Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 82|回复: 0

果只有少量数据丢失您只

[复制链接]

10

主题

10

帖子

32

积分

新手上路

Rank: 1

积分
32
发表于 2024-2-14 14:47:57 | 显示全部楼层 |阅读模式
需删除相关的行或列即可。当然只有当缺失数据量很小并且数据对分析不重要时这才是一种选择。 如果大量数据丢失这在大量机器学习数据集中可能更常见另一种选择是通过用估计值替换缺失值来估算丢失的数据。我可以通过使用数据的平均值或中位数或者通过应用回归模型来预测缺失值来做到这一点。 如果数据完全随机丢失我可能会使用多重插补来估计缺失值。这是一种使用统计技术的更复杂的方法。还可以选择为缺失值创建一个“未知类别。  机器学习面试问题公司和行业特定问题 正如本节标题所示此类问题将针对您所申请工作的公司和行业。这使得预测这些类型的问题变得更加困难但这里有一些广泛的示例可以让您了解会发生什么。 Q。您将如何使用机器学习来支持我们的业务 回答从。

广义上讲这是您可能会遇到的一个常见问题尽管在上下文中可能更具体。不过回答这个问题的一般方法应该关注公司的目标、面临的问题以及可以访问的数据类型。例如也许您正在申请一家媒体公司该公司需要为其订阅者提供新的个性化推荐引擎。您需要哪些数据来创建这个以及您 俄罗斯手机号码数据 将如何设计合适的算法 或者也许您正在申请在一家金融机构工作。您如何使用机器学习来检测和防止欺诈您可以使用哪些现有客户数据虽然问题的具体情况会根据具体情况而有所不同但这个问题总是需要在面试之前仔细倾听并研究公司。 Q 您认为我们行业中最有价值的数据是什么 回答继上一个问题之后我们将更深入地了解公司收集的数据类型以及他们目前如何使用这些数据。虽然他们不太可能期望你了解他们内部运作的一切但你应该研究。



他们的商业模式和行业格局。 此类问题是开始对话的最佳机会可以就他们的目标、他们拥有的数据以及他们缺少的数据提出深思熟虑的问题。这样做将表明您正在仔细考虑他们的需求同时为他们提供一些有关您可能为业务带来的价值的见解。 Q 您将如何改进我们当前的数据收集流程 答这是一道机器学习面试题需要仔细回答。该问题旨在确定您对他们的业务模式以及当前机器学习和数据收集方法的掌握程度。但是请小心不要踩到他们的脚趾 “我认为有几种方法可以改进数据收集流程。首先我建议更频繁地收集客户数据以便您随着时间的推移跟踪他们的行为。这将改善预测并推动更准确的业务决策。我还建议从更广泛的来源收集数据。这将更全面地了解该行业正在发生的事情。它还允许您为机器学习模型提供更大的数据。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2026-1-14 20:11 , Processed in 0.039515 second(s), 18 queries .

Powered by Discuz! DISCUZ_VERSION

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表