R语言contextual包说明文档(版本 0.9.8.4)
返回R语言所有包列表
Agent
代理人
agent
代理人
arms
绘图
average
绘图
Bandit
强盗:超类
bandit
强盗:超类
BasicBernoulliBandit
强盗:BasicBernoulliBandit
BasicGaussianBandit
强盗:BasicGaussianBandit
BootstrapTSPolicy
政策:汤普森抽样与在线引导
check_history_data
绘图
clear_data_table
历史
clipr
剪辑向量
ContextualBernoulliBandit
土匪:天真的伯努利土匪
ContextualBinaryBandit
强盗:背景
ContextualEpochGreedyPolicy
策略:一种时空高效的上下文线性强盗算法
ContextualEpsilonGreedyPolicy
策略:具有唯一线性模型的ContextualEpsilonGreedyPolicy
ContextualHybridBandit
土匪:背景杂交土匪
ContextualLinearBandit
班迪特:背景班迪特
ContextualLinTSPolicy
策略:具有唯一线性模型的线性汤普森抽样
ContextualLogitBandit
土匪:背景土匪
ContextualLogitBTSPolicy
策略:上下文策略
ContextualPrecachingBandit
班迪特:背景预测班迪特
ContextualTSProbitPolicy
策略:上下文移动策略
ContextualWheelBandit
班迪特:背景车轮班迪特
ContinuumBandit
强盗:继续
cumulative
历史
data_table_factors_to_numeric
转换中的所有因子列数据表到数字
dec
减量
dinvgamma
逆伽马分布
do_plot
绘图
do_step
代理人
EpsilonFirstPolicy
策略:Epsilon优先
EpsilonGreedyPolicy
策略:Epsilon Greedy
Exp3Policy
策略:Exp3
FixedPolicy
策略:固定臂
formatted_difftime
设置difftime对象的格式
generate_bandit_data
强盗:超类
get_action
策略:超类
get_arm_context
返回手臂的上下文向量
get_context
强盗:超类
get_data_frame
历史
get_data_table
历史
get_full_context
获取所有手臂的完整上下文矩阵
get_global_seed
查找。随机种子在全球环境中
get_t
代理人
gg_color_hue
绘图
gittinsbrezzilai
策略:在单抗问题中选择武器的Gittins近似算法。
GittinsBrezziLaiPolicy
策略:在单抗问题中选择武器的Gittins近似算法。
GradientPolicy
策略:梯度
History
历史
inc
增量
ind
公式中使用的即时指示函数
initialize_theta
策略:超类
inv
Choleski(或QR)分解的逆。
invgamma
逆伽马分布
invlogit
逆Logit函数
is_rstudio
检查是否在RStudio中
LifPolicy
策略:带锁定反馈的连续体Bandit策略
LinUCBDisjointOptimizedPolicy
策略:具有唯一线性模型的LinUCB
LinUCBDisjointPolicy
策略:具有唯一线性模型的LinUCB
LinUCBGeneralPolicy
策略:具有唯一线性模型的LinUCB
LinUCBHybridOptimizedPolicy
策略:具有混合线性模型的LinUCB
LinUCBHybridPolicy
策略:具有混合线性模型的LinUCB
load
历史
mvrnorm
从多元正态分布模拟
OfflineBootstrappedReplayBandit
Bandit:离线引导重播
OfflineDirectMethodBandit
强盗:离线直接方法
OfflineDoublyRobustBandit
强盗:离线双倍健壮
OfflineLookupReplayEvaluatorBandit
Bandit:带查找表的脱机重播
OfflinePropensityWeightingBandit
Bandit:离线倾向加权重播
OfflineReplayEvaluatorBandit
Bandit:离线重播
ones_in_zeroes
由0和1组成的向量
one_hot
一个热编码数据表柱
optimal
绘图
OraclePolicy
策略:Oracle
pinvgamma
逆伽马分布
Plot
绘图
plot.History
上下文历史的绘图方法
plot.history
上下文历史的绘图方法
Policy
策略:超类
policy
策略:超类
post_initialization
强盗:超类
print.History
上下文历史的打印方法
print.history
上下文历史的打印方法
print_data
历史
prob_winner
二项式获胜概率
qinvgamma
逆伽马分布
RandomPolicy
策略:随机
rinvgamma
逆伽马分布
run
模拟器
sample_one_of
从向量或列表中抽取一个元素
save
历史
set_data_frame
历史
set_data_table
历史
set_external
从RStudio更改默认绘图设备
set_global_seed
设置。随机种子到预先保存的值
set_parameters
策略:超类
set_reward
策略:超类
set_t
代理人
sherman_morrisson
谢尔曼-莫里森逆
Simulator
模拟器
simulator
模拟器
sim_post
二项式后验模拟器
SoftmaxPolicy
策略:Softmax
summary.History
上下文历史的摘要方法
summary.history
上下文历史的摘要方法
sum_of
列表的总和
theta
策略:超类
ThompsonSamplingPolicy
政策:汤普森抽样
UCB1Policy
政策:UCB1
UCB2Policy
政策:UCB2
value_remaining
潜在剩余价值
var_welford
韦尔福德方差
which_max_list
获取列表中的最大值
which_max_tied
随机断开领带获得最大值