paper:Assessing the Value of Data Assets: An Exploratory Study of Valuation Methods
此篇文章的阅读仅用于审稿
1.来自claude2的总结
1.1数据资产的定义和特征
数据资产是企业合法拥有或控制的、能为企业带来未来经济效益的数据资源。
数据资产具有价值增值、可共享、可控性和可量化的特征。
1.2数据资产评估方法
非货币计量法:根据数据的客观特征、对企业的价值贡献以及应用前后企业KPI变化进行评估。
货币计量法:成本法、收入法和市场法。
1.3综合评估模型
以货币计量法为核心。
非货币计量法的评估因素作为调节因素。
考虑历史成本、超额业务收益、可比数据资产价格等因素。
1.4数据资产评估的意义
优化企业数据资源配置,发掘有利数据资产。
推动数据要素市场
审稿意见
有用的链接:
🔗:审稿意见模版1
🔗:审稿意见模版2
作为科研新手,有时候会接到一些协助审稿的任务,对于在这方面经验比较少的同学来说,顺利给出合适公允的审稿意见往往是有困难的。其实审阅论文也是学习如何写论文的一种过程,是有法可循的。本文从科研新手的角度提供了一些基本的建议。
内心中需要带着的问题:
摘要是否简洁明了的概括了全文,包括目的、方法、结果和结论,结果部分是否有详细的数据支撑;
introduction 部分,作者是否提供了详细的背景资料;
文中所有的描述是否清晰,表格和数字是否清晰无误;
研究的潜在价值清楚吗,可重点看摘要中结论和文末conclusion部分;
研究方法是否介
code:causal analysis churn
此篇文章是用来梳理"paper:Causal Analysis Churn"的代码
流程:
1.导入数据集
2.将前两个数据集拼接在一起
3.特征工程:
3.1创建副本 删掉重复行
3.2找到分类列和数量列
3.3删掉高相关性特征
3.4预处理:对类别特征进行one-hot编码
4.模型评估
4.1对训练数据进行欠采样处理
4.2评估指标
5.集成学习
5.1建立集成学习分类器-hard
5.2建立集成学习分类器-soft
6.特征选择-随机森林变量的重要性
6.1训练随机森林分类器
6.2显示重要性最大的前180个
6.3将重要性前100个存入列表
shap
SHAP Values
SHAP代表沙普利加性解释(SHapley Additive exPlanation),有助于分解预测以显示每个特征的影响。它基于沙普利值(Shapley values),这是一种用于博弈论的技术,用于确定协作游戏中每个玩家对其成功的贡献有多少¹。通常,正确地获得准确性和可解释性之间的权衡可能是一个困难的平衡行为,但SHAP值可以同时提供两者。
SHAP values解释了给定功能具有特定值的影响,并与我们在该功能具有一些基线值时所做的预测进行比较。
Shap值显示了给定功能对我们预测的改变程度(与我们在该功能的某个基线值上进行预测相比)。
Causal Reasoning
🔗:Causal Reasoning: Fundamentals and Machine Learning Applications
1.因果推理book
1.1介绍
想法💡:我们不仅要了解系统做出决定的原因,还要了解该决定的影响(和副作用),以及如何改善决策以实现更理想的结果。
首先,让我们简单而非正式地将因果推理定义为因果问题的研究,例如:A会导致B吗?向用户推荐产品会让他们更有可能购买吗?如果是这样,可能性有多大?是什么让一个人更有可能偿还贷款或成为好员工(或雇主)?如果天气变热,庄稼会枯萎吗?因果推理是研究这些问题以及如何回答它们。
1.2什么是因果推理?
1.2.1简单的
photo
此条帖子仅仅用来记述常用的封面照片
1.keria
2.T1
3.🐱
4. 八月十九 t1 kt
5.faker
6.zeus
7.code
8.cat
9.王菲
10.星之卡比
11.gear second
12.再见绘梨
13.
14.
15.
Ensemble
此文章的方法来源于论文《Causal Analysis of Customer Churn Using Deep Learning》
Ensemble on Simple base Models
投票集成(或“多数投票集成”)是一种集成机器学习模型,它结合了多个其他模型的预测。
它是一种可用于提高模型性能的技术,理想情况下可以获得比集成中使用的任何单个模型更好的性能。
投票集成通过组合来自多个模型的预测来工作。它可以用于分类或回归。对于回归来说,这涉及计算模型预测的平均值。在分类的情况下,对每个标签的预测结果求和,并预测投票结果最多的标签。
硬投票:从模型中预测得票总和最大的类别
在硬投
Model Evaluation
模型评估标准
常见的模型评估标准有:sensitivity, specificity, Precision, F1-measure, Geometric mean and mathew correlation coefficient and finally ROC AUC curve
1.confusion matrix
混淆矩阵是一个表,通常用来描述分类模型(或“分类器”)在一组已知真实值的测试数据上的性能。混淆矩阵本身相对容易理解,但相关的术语可能会令人困惑。
二元分类器的混淆矩阵示例:
我们能从上面了解到的东西:
有两种可能的预测类别:“是”和“否”。例如,如果我们预测某种疾病的
paper-introduction
Paper Introduction
学术期刊and学术会议
学术会议和学术期刊是学术界常见的两种学术交流方式、投稿方式
1.学术期刊
学术期刊是由特定的国家官方机构、行政部门、国家批准认可的团体、学会等部门主管、主办的学术性期刊、主要刊载学会论文、研究报告、评论等文章,以专业工作者为主要对象。
按学术地位分类,可以分为:核心期刊和非核心期刊。
期刊投稿流程:
完成论文
投稿到期刊
期刊安排审稿录用
交版面费
期刊出版论文
出版社将论文提交数据库检索
2.学术会议
学术会议是有高校、研究院所、出版商、企业等机构针对某一专题、课题、领域召开的同行业研讨会、论坛等。会议征集的稿件会以”
« 上一页 1 … 26 27 28 29 30 31 下一页 »