R语言contextual包说明文档(版本 0.9.8.4)

返回R语言所有包列表

Agent 代理人
agent 代理人
arms 绘图
average 绘图
Bandit 强盗:超类
bandit 强盗:超类
BasicBernoulliBandit 强盗:BasicBernoulliBandit
BasicGaussianBandit 强盗:BasicGaussianBandit
BootstrapTSPolicy 政策:汤普森抽样与在线引导
check_history_data 绘图
clear_data_table 历史
clipr 剪辑向量
ContextualBernoulliBandit 土匪:天真的伯努利土匪
ContextualBinaryBandit 强盗:背景
ContextualEpochGreedyPolicy 策略:一种时空高效的上下文线性强盗算法
ContextualEpsilonGreedyPolicy 策略:具有唯一线性模型的ContextualEpsilonGreedyPolicy
ContextualHybridBandit 土匪:背景杂交土匪
ContextualLinearBandit 班迪特:背景班迪特
ContextualLinTSPolicy 策略:具有唯一线性模型的线性汤普森抽样
ContextualLogitBandit 土匪:背景土匪
ContextualLogitBTSPolicy 策略:上下文策略
ContextualPrecachingBandit 班迪特:背景预测班迪特
ContextualTSProbitPolicy 策略:上下文移动策略
ContextualWheelBandit 班迪特:背景车轮班迪特
ContinuumBandit 强盗:继续
cumulative 历史
data_table_factors_to_numeric 转换中的所有因子列数据表到数字
dec 减量
dinvgamma 逆伽马分布
do_plot 绘图
do_step 代理人
EpsilonFirstPolicy 策略:Epsilon优先
EpsilonGreedyPolicy 策略:Epsilon Greedy
Exp3Policy 策略:Exp3
FixedPolicy 策略:固定臂
formatted_difftime 设置difftime对象的格式
generate_bandit_data 强盗:超类
get_action 策略:超类
get_arm_context 返回手臂的上下文向量
get_context 强盗:超类
get_data_frame 历史
get_data_table 历史
get_full_context 获取所有手臂的完整上下文矩阵
get_global_seed 查找。随机种子在全球环境中
get_t 代理人
gg_color_hue 绘图
gittinsbrezzilai 策略:在单抗问题中选择武器的Gittins近似算法。
GittinsBrezziLaiPolicy 策略:在单抗问题中选择武器的Gittins近似算法。
GradientPolicy 策略:梯度
History 历史
inc 增量
ind 公式中使用的即时指示函数
initialize_theta 策略:超类
inv Choleski(或QR)分解的逆。
invgamma 逆伽马分布
invlogit 逆Logit函数
is_rstudio 检查是否在RStudio中
LifPolicy 策略:带锁定反馈的连续体Bandit策略
LinUCBDisjointOptimizedPolicy 策略:具有唯一线性模型的LinUCB
LinUCBDisjointPolicy 策略:具有唯一线性模型的LinUCB
LinUCBGeneralPolicy 策略:具有唯一线性模型的LinUCB
LinUCBHybridOptimizedPolicy 策略:具有混合线性模型的LinUCB
LinUCBHybridPolicy 策略:具有混合线性模型的LinUCB
load 历史
mvrnorm 从多元正态分布模拟
OfflineBootstrappedReplayBandit Bandit:离线引导重播
OfflineDirectMethodBandit 强盗:离线直接方法
OfflineDoublyRobustBandit 强盗:离线双倍健壮
OfflineLookupReplayEvaluatorBandit Bandit:带查找表的脱机重播
OfflinePropensityWeightingBandit Bandit:离线倾向加权重播
OfflineReplayEvaluatorBandit Bandit:离线重播
ones_in_zeroes 由0和1组成的向量
one_hot 一个热编码数据表柱
optimal 绘图
OraclePolicy 策略:Oracle
pinvgamma 逆伽马分布
Plot 绘图
plot.History 上下文历史的绘图方法
plot.history 上下文历史的绘图方法
Policy 策略:超类
policy 策略:超类
post_initialization 强盗:超类
print.History 上下文历史的打印方法
print.history 上下文历史的打印方法
print_data 历史
prob_winner 二项式获胜概率
qinvgamma 逆伽马分布
RandomPolicy 策略:随机
rinvgamma 逆伽马分布
run 模拟器
sample_one_of 从向量或列表中抽取一个元素
save 历史
set_data_frame 历史
set_data_table 历史
set_external 从RStudio更改默认绘图设备
set_global_seed 设置。随机种子到预先保存的值
set_parameters 策略:超类
set_reward 策略:超类
set_t 代理人
sherman_morrisson 谢尔曼-莫里森逆
Simulator 模拟器
simulator 模拟器
sim_post 二项式后验模拟器
SoftmaxPolicy 策略:Softmax
summary.History 上下文历史的摘要方法
summary.history 上下文历史的摘要方法
sum_of 列表的总和
theta 策略:超类
ThompsonSamplingPolicy 政策:汤普森抽样
UCB1Policy 政策:UCB1
UCB2Policy 政策:UCB2
value_remaining 潜在剩余价值
var_welford 韦尔福德方差
which_max_list 获取列表中的最大值
which_max_tied 随机断开领带获得最大值