R语言contextual包函数列表及帮助文档

R语言contextual包说明文档（版本 0.9.8.4）

		Agent	代理人
		agent	代理人
		arms	绘图
		average	绘图
		Bandit	强盗：超类
		bandit	强盗：超类
		BasicBernoulliBandit	强盗：BasicBernoulliBandit
		BasicGaussianBandit	强盗：BasicGaussianBandit
		BootstrapTSPolicy	政策：汤普森抽样与在线引导
		check_history_data	绘图
		clear_data_table	历史
		clipr	剪辑向量
		ContextualBernoulliBandit	土匪：天真的伯努利土匪
		ContextualBinaryBandit	强盗：背景
		ContextualEpochGreedyPolicy	策略：一种时空高效的上下文线性强盗算法
		ContextualEpsilonGreedyPolicy	策略：具有唯一线性模型的ContextualEpsilonGreedyPolicy
		ContextualHybridBandit	土匪：背景杂交土匪
		ContextualLinearBandit	班迪特：背景班迪特
		ContextualLinTSPolicy	策略：具有唯一线性模型的线性汤普森抽样
		ContextualLogitBandit	土匪：背景土匪
		ContextualLogitBTSPolicy	策略：上下文策略
		ContextualPrecachingBandit	班迪特：背景预测班迪特
		ContextualTSProbitPolicy	策略：上下文移动策略
		ContextualWheelBandit	班迪特：背景车轮班迪特
		ContinuumBandit	强盗：继续
		cumulative	历史
		data_table_factors_to_numeric	转换中的所有因子列数据表到数字
		dec	减量
		dinvgamma	逆伽马分布
		do_plot	绘图
		do_step	代理人
		EpsilonFirstPolicy	策略：Epsilon优先
		EpsilonGreedyPolicy	策略：Epsilon Greedy
		Exp3Policy	策略：Exp3
		FixedPolicy	策略：固定臂
		formatted_difftime	设置difftime对象的格式
		generate_bandit_data	强盗：超类
		get_action	策略：超类
		get_arm_context	返回手臂的上下文向量
		get_context	强盗：超类
		get_data_frame	历史
		get_data_table	历史
		get_full_context	获取所有手臂的完整上下文矩阵
		get_global_seed	查找。随机种子在全球环境中
		get_t	代理人
		gg_color_hue	绘图
		gittinsbrezzilai	策略：在单抗问题中选择武器的Gittins近似算法。
		GittinsBrezziLaiPolicy	策略：在单抗问题中选择武器的Gittins近似算法。
		GradientPolicy	策略：梯度
		History	历史
		inc	增量
		ind	公式中使用的即时指示函数
		initialize_theta	策略：超类
		inv	Choleski（或QR）分解的逆。
		invgamma	逆伽马分布
		invlogit	逆Logit函数
		is_rstudio	检查是否在RStudio中
		LifPolicy	策略：带锁定反馈的连续体Bandit策略
		LinUCBDisjointOptimizedPolicy	策略：具有唯一线性模型的LinUCB
		LinUCBDisjointPolicy	策略：具有唯一线性模型的LinUCB
		LinUCBGeneralPolicy	策略：具有唯一线性模型的LinUCB
		LinUCBHybridOptimizedPolicy	策略：具有混合线性模型的LinUCB
		LinUCBHybridPolicy	策略：具有混合线性模型的LinUCB
		load	历史
		mvrnorm	从多元正态分布模拟
		OfflineBootstrappedReplayBandit	Bandit:离线引导重播
		OfflineDirectMethodBandit	强盗：离线直接方法
		OfflineDoublyRobustBandit	强盗：离线双倍健壮
		OfflineLookupReplayEvaluatorBandit	Bandit:带查找表的脱机重播
		OfflinePropensityWeightingBandit	Bandit:离线倾向加权重播
		OfflineReplayEvaluatorBandit	Bandit:离线重播
		ones_in_zeroes	由0和1组成的向量
		one_hot	一个热编码数据表柱
		optimal	绘图
		OraclePolicy	策略：Oracle
		pinvgamma	逆伽马分布
		Plot	绘图
		plot.History	上下文历史的绘图方法
		plot.history	上下文历史的绘图方法
		Policy	策略：超类
		policy	策略：超类
		post_initialization	强盗：超类
		print.History	上下文历史的打印方法
		print.history	上下文历史的打印方法
		print_data	历史
		prob_winner	二项式获胜概率
		qinvgamma	逆伽马分布
		RandomPolicy	策略：随机
		rinvgamma	逆伽马分布
		run	模拟器
		sample_one_of	从向量或列表中抽取一个元素
		save	历史
		set_data_frame	历史
		set_data_table	历史
		set_external	从RStudio更改默认绘图设备
		set_global_seed	设置。随机种子到预先保存的值
		set_parameters	策略：超类
		set_reward	策略：超类
		set_t	代理人
		sherman_morrisson	谢尔曼-莫里森逆
		Simulator	模拟器
		simulator	模拟器
		sim_post	二项式后验模拟器
		SoftmaxPolicy	策略：Softmax
		summary.History	上下文历史的摘要方法
		summary.history	上下文历史的摘要方法
		sum_of	列表的总和
		theta	策略：超类
		ThompsonSamplingPolicy	政策：汤普森抽样
		UCB1Policy	政策：UCB1
		UCB2Policy	政策：UCB2
		value_remaining	潜在剩余价值
		var_welford	韦尔福德方差
		which_max_list	获取列表中的最大值
		which_max_tied	随机断开领带获得最大值