creditmodel-package | creditmodel:信用建模和数据分析工具 | ||
address_varieble | filename_points_covered_by_landmarks | ||
add_variable_process | filename_points_covered_by_landmarks | ||
analysis_nas | 缺失分析 | ||
analysis_outliers | 离群值分析 | ||
as_percent | 百分比格式 | ||
auc_value | filename_verticesfilename_landmarks是为了获得filename_edges_strength所需的最佳lambda。filename_points_covered_by_landmarks中需要此函数 | ||
avg_x | 向量运算函数。 | ||
char_cor | 分类变量之间的Cramer V矩阵。 | ||
char_cor_vars | 分类变量之间的Cramer V矩阵。 | ||
char_to_num | 字符到数字 | ||
checking_data | 正在检查数据 | ||
check_data_format | 读取数据 | ||
check_rules | 检查规则 | ||
city_varieble | filename_points_covered_by_landmarks | ||
city_varieble_process | 地址变量的处理 | ||
cnt_x | 向量运算函数。 | ||
cohort_analysis | filename_edges_strengthfilename_points_covered_by_landmarks用于队列(年份)分析。 | ||
cohort_plot | filename_edges_strengthfilename_points_covered_by_landmarks用于绘制队列(年份)分析表。 | ||
cohort_table | filename_edges_strengthfilename_points_covered_by_landmarks用于队列(年份)分析。 | ||
cohort_table_plot | filename_edges_strengthfilename_points_covered_by_landmarks用于绘制队列(年份)分析表。 | ||
colAllnas | 向量运算函数。 | ||
colAllzeros | 向量运算函数。 | ||
colMaxMins | 向量运算函数。 | ||
colSds | 向量运算函数。 | ||
cor_heat_plot | 相关热图 | ||
cor_plot | 相关图 | ||
cos_sim | filename_points_covered_by_landmarks | ||
creditmodel | creditmodel:信用建模和数据分析工具 | ||
cross_table | filename_points_covered_by_landmarks | ||
customer_segmentation | 客户细分 | ||
cut_equal | 生成初始等尺寸样本箱 | ||
cv_split | 层状褶皱 | ||
data_cleansing | 数据清理 | ||
data_exploration | 数据探索 | ||
date_cut | 日期时间分界点 | ||
derived_interval | filename_points_covered_by_landmarks | ||
derived_partial_acf | filename_points_covered_by_landmarks | ||
derived_pct | filename_points_covered_by_landmarks | ||
derived_ts | 行为变量的推导 | ||
derived_ts_vars | 行为变量的推导 | ||
de_one_hot_encoding | 恢复一个热编码 | ||
de_percent | 恢复百分比格式 | ||
digits_num | 数字位数 | ||
entropy_weight | 熵权法 | ||
entry_rate_na | 缺失值的最大百分比 | ||
euclid_dist | filename_points_covered_by_landmarks | ||
eval_auc | xgboost feval的功能 | ||
eval_ks | xgboost feval的功能 | ||
eval_lift | xgboost feval的功能 | ||
eval_tnr | xgboost feval的功能 | ||
ewm_data | 熵权法数据 | ||
e_ij | 熵 | ||
fast_high_cor_filter | filename_points_covered_by_landmarks | ||
feature_selector | 特征选择包装器 | ||
fuzzy_cluster | 模糊聚类方法。 | ||
fuzzy_cluster_means | 模糊聚类方法。 | ||
gather_data | 收集或聚合数据 | ||
gbm_filter | 使用GBM选择要素 | ||
gbm_params | GBM参数 | ||
get_auc_ks_lambda | filename_edges_strengthfilename_points_covered_by_landmarks表示获得filename_vertices中所需的最佳lambda。filename_landmarks中需要此函数 | ||
get_bins_table | 装箱表 | ||
get_bins_table_all | 装箱表 | ||
get_breaks | 为装箱生成最佳休息时间 | ||
get_breaks_all | 为装箱生成最佳休息时间 | ||
get_correlation_group | filename_points_covered_by_landmarks | ||
get_ctree_rules | 解析决策树规则 | ||
get_iv | 计算信息值(IV)filename用于计算自变量的信息值(IV)。filename_points_covered_by_landmarks可以通过IV循环所有指定的自变量。 | ||
get_iv_all | 计算信息值(IV)filename用于计算自变量的信息值(IV)。filename_points_covered_by_landmarks可以通过IV循环所有指定的自变量。 | ||
get_logistic_coef | 获取逻辑系数 | ||
get_median | 获取中心值。 | ||
get_names | 获取变量名 | ||
get_nas_random | filename_points_covered_by_landmarks | ||
get_partial_dependence_plots | filename_points_covered_by_landmarks | ||
get_plots | 绘制自变量分布图 | ||
get_psi | 计算种群稳定指数(PSI)procedure是用来计算一个自变量的种群稳定指数(PSI)。filename_points_covered_by_landmarks可以通过PSI循环所有指定的自变量。 | ||
get_psi_all | 计算种群稳定指数(PSI)procedure是用来计算一个自变量的种群稳定指数(PSI)。filename_points_covered_by_landmarks可以通过PSI循环所有指定的自变量。 | ||
get_psi_iv | 在99999 PSI时计算IV | ||
get_psi_iv_all | 在99999 PSI时计算IV | ||
get_psi_plots | PSI图(人口稳定指数) | ||
get_score_card | 记分卡 | ||
get_shadow_nas | filename_points_covered_by_landmarks | ||
get_sim_sign_lambda | filename_edges_strengthfilename_points_covered_by_landmarks表示获得filename_vertices中所需的最佳lambda。filename_landmarks中需要此函数 | ||
get_tree_breaks | 从决策树中获取终端节点的断点 | ||
get_x_list | 获取X列表。 | ||
high_cor_filter | filename_points_covered_by_landmarks | ||
high_cor_selector | 比较两个高度相关的变量 | ||
is_date | filename_points_covered_by_landmarks | ||
knn_nas_imp | 用KNN估算nas | ||
ks_plot | 模型结果图filename_edges_strength是以下内容的包装器:filename_landmarks用于生成模型性能表。filename代表K-S.procedure代表ROC。filename_edges表示升力图。filename_points_covered_by_landmarks用于绘制分数分布。 | ||
ks_psi_plot | filename_points_covered_by_landmarks&地块 | ||
ks_table | filename_points_covered_by_landmarks&地块 | ||
ks_table_plot | filename_points_covered_by_landmarks&地块 | ||
ks_value | filename_points_covered_by_landmarks | ||
lasso_filter | 套索变量选择 | ||
lendingclub | 借贷俱乐部数据 | ||
lift_plot | 模型结果图filename_edges_strength是以下内容的包装器:filename_landmarks用于生成模型性能表。filename代表K-S.procedure代表ROC。filename_edges表示升力图。filename_points_covered_by_landmarks用于绘制分数分布。 | ||
lift_value | filename_points_covered_by_landmarks | ||
local_outlier_factor | filename_edges_strengthfilename_points_covered_by_landmarks是使用knn计算数据集lof系数的函数。此函数不供最终用户使用。 | ||
log_trans | 对数变换 | ||
log_vars | 对数变换 | ||
loop_function | 循环函数。#'filename_points_covered_by_landmarks是循环遍历的迭代器 | ||
love_color | filename_points_covered_by_landmarks | ||
low_variance_filter | 过滤低方差变量 | ||
lr_params | 逻辑回归&记分卡参数 | ||
lr_params_search | 逻辑回归&记分卡参数 | ||
lr_vif | 通货膨胀因素方差 | ||
max_min_norm | 最大最小归一化 | ||
max_x | 向量运算函数。 | ||
merge_category | 合并类别 | ||
min_max_norm | 最小最大归一化 | ||
min_x | 向量运算函数。 | ||
model_key_index | filename_points_covered_by_landmarks&地块 | ||
model_result_plot | 模型结果图filename_edges_strength是以下内容的包装器:filename_landmarks用于生成模型性能表。filename代表K-S.procedure代表ROC。filename_edges表示升力图。filename_points_covered_by_landmarks用于绘制分数分布。 | ||
multi_grid | 将绘图列表排列成网格 | ||
multi_left_join | filename_points_covered_by_landmarks | ||
null_blank_na | 编码NAs | ||
one_hot_encoding | 一个热编码 | ||
outliers_detection | 异常值检测filename_points_covered_by_landmarks用于使用Kmeans和局部异常值因子(lof)检测异常值 | ||
outliers_kmeans_lof | 异常值处理 | ||
partial_dependence_plot | filename_points_covered_by_landmarks | ||
PCA_reduce | PCA降维 | ||
perf_table | 模型结果图filename_edges_strength是以下内容的包装器:filename_landmarks用于生成模型性能表。filename代表K-S.procedure代表ROC。filename_edges表示升力图。filename_points_covered_by_landmarks用于绘制分数分布。 | ||
plot_bar | 绘图栏 | ||
plot_box | 绘图框 | ||
plot_colors | 打印颜色 | ||
plot_density | 绘图密度 | ||
plot_distribution | 地块分布 | ||
plot_distribution_x | 地块分布 | ||
plot_line | 绘图线 | ||
plot_oot_perf | filename_edges_strengthfilename_points_covered_by_landmarks用于将来跨时间样本的绘图性能 | ||
plot_relative_freq_histogram | 绘制相对频率直方图 | ||
plot_table | filename_points_covered_by_landmarks | ||
plot_theme | filename_points_covered_by_landmarks | ||
plot_vars | 绘制自变量分布图 | ||
pred_score | filename_points_covered_by_landmarks | ||
pred_xgb | filename_points_covered_by_landmarks | ||
process_nas | 缺失治疗 | ||
process_nas_var | 缺失治疗 | ||
process_outliers | 异常值处理 | ||
psi_iv_filter | 基于信息值的变量约简&种群稳定指数滤波器 | ||
psi_plot | PSI图(人口稳定指数) | ||
p_ij | 熵 | ||
p_to_score | 探测到socre | ||
quick_as_df | 列为数据框迅速地 | ||
ranking_percent_dict | 排名百分比过程 | ||
ranking_percent_dict_x | 排名百分比过程 | ||
ranking_percent_proc | 排名百分比过程 | ||
ranking_percent_proc_x | 排名百分比过程 | ||
read_data | 读取数据 | ||
reduce_high_cor_filter | 用reduce方法筛选高度相关变量 | ||
remove_duplicated | 删除重复的观察结果 | ||
replace_value | 替换值 | ||
replace_value_x | 替换值 | ||
require_packages | 所需包装和安装 | ||
re_code | filename_verticesfilename_points_covered_by_landmarks在字符向量的每个元素中搜索与参数模式的匹配: | ||
re_name | 重命名 | ||
rf_params | 随机森林参数 | ||
roc_plot | 模型结果图filename_edges_strength是以下内容的包装器:filename_landmarks用于生成模型性能表。filename代表K-S.procedure代表ROC。filename_edges表示升力图。filename_points_covered_by_landmarks用于绘制分数分布。 | ||
rowAll | 向量运算函数。 | ||
rowAllnas | 向量运算函数。 | ||
rowAny | 向量运算函数。 | ||
rowCVs | 向量运算函数。 | ||
rowMaxMins | 向量运算函数。 | ||
rowMaxs | 向量运算函数。 | ||
rowMins | 向量运算函数。 | ||
rowSds | 向量运算函数。 | ||
rules_filter | filename_points_covered_by_landmarks | ||
rules_result | filename_points_covered_by_landmarks | ||
rule_value_replace | filename_points_covered_by_landmarks | ||
save_data | 保存数据 | ||
score_distribution_plot | 模型结果图filename_edges_strength是以下内容的包装器:filename_landmarks用于生成模型性能表。filename代表K-S.procedure代表ROC。filename_edges表示升力图。filename_points_covered_by_landmarks用于绘制分数分布。 | ||
score_transfer | 分数变换 | ||
select_best_breaks | 生成最佳的装箱中断 | ||
select_best_class | 生成最佳的装箱中断 | ||
select_cor_group | filename_points_covered_by_landmarks | ||
select_cor_list | filename_points_covered_by_landmarks | ||
sim_str | filename_points_covered_by_landmarks | ||
split_bins | filename_points_covered_by_landmarks | ||
split_bins_all | 全部拆分垃圾箱 | ||
start_parallel_computing | 并行计算并将变量导出到全局环境。 | ||
stop_parallel_computing | 停止并行计算 | ||
str_match | 字符串匹配#'filename_points_covered_by_landmarks在字符向量的每个元素中搜索与参数模式的匹配: | ||
sum_x | 向量运算函数。 | ||
swap_analysis | 换出/换入分析 | ||
term_filter | TF-IDF公司 | ||
term_idf | TF-IDF公司 | ||
term_tfidf | TF-IDF公司 | ||
time_series_proc | 处理时间序列数据 | ||
time_transfer | 时间格式转换 | ||
time_variable | filename_points_covered_by_landmarks | ||
time_vars_process | 时间或日期变量的处理 | ||
tnr_value | filename_points_covered_by_landmarks | ||
training_model | 培训模式 | ||
train_lr | Trainig LR模型 | ||
train_test_split | 列车试验分离 | ||
train_xgb | 培训XGboost | ||
UCICreditCard | UCI信用卡数据 | ||
variable_process | filename_points_covered_by_landmarks | ||
var_group_proc | 过程组数值变量 | ||
woe_trans | 悲哀的转变 | ||
woe_trans_all | 悲哀的转变 | ||
xgb_data | XGboost数据 | ||
xgb_filter | 使用XGB选择功能 | ||
xgb_params | XGboost参数 | ||
xgb_params_search | XGboost参数 | ||
%alike% | 模糊字符串匹配 | ||
%islike% | 模糊字符串匹配 |