英语轻松读发新版了,欢迎下载、更新

“我最大的教训是意识到领域专业知识比算法复杂性重要。”|迈向数据科学

2025-08-14 13:59:57 英文原文

作者:TDS Editors

在作者聚光灯系列中,TDS编辑与我们社区成员聊天,谈论他们在数据科学和AI,写作以及灵感来源方面的职业道路。今天,我们很高兴与我们分享我们的对话Claudia ng

克劳迪娅(Claudia)是一位AI企业家和数据科学家,在金融科技(Fintech)中建立生产机器学习模型6年以上。她在2024年的Web3信用评分ML比赛中获得了第二名,并赢得了10,000美元。


您最近在机器学习比赛中赢得了10,000美元恭喜!您从这种经历中获得的最大教训是什么?如何影响您解决现实世界中ML问题的方法?

我最大的教训是意识到领域专业知识比算法复杂性更重要。这是一项Web3信用评分ML竞赛,尽管从未使用过区块链数据或神经网络进行信用评分,但我在金融科技工作的6年以上,使我成为了将其视为标准信用风险问题的业务直觉。这种观点比任何程度或深度学习专业化都更有价值。

这种经验从根本上改变了我如何通过两种方式解决ML问题:

首先,我了解到运输胜于完美。我只花了10个小时参加比赛,并提交了MVP方法,而不是过度工程。这直接适用于行业工作:在生产中运行的一个体面的模型比位于jupyter笔记本中的高度优化模型具有更多的价值。

其次,我发现大多数障碍都是精神上的,而不是技术性的。我几乎没有进入,因为我不知道web3,也不是一个竞争者,但是回想起来,我对此进行了过度思考。尽管我仍在更广泛地努力应用本课程,但它改变了我评估机会的方式。现在,我专注于我是否了解核心问题以及它是否引起我的兴奋,并相信我将能够在我走时弄清楚。

您的职业道路跨越商业,公共政策,机器学习以及现在的AI顾问。是什么促使您从公司技术转移到人工智能自由世界,还有什么最让您对这篇新章节感到兴奋?您最兴奋的是哪些挑战或客户?

向独立工作的转变是通过想要建立我可以真正拥有和成长的东西来驱动的。在公司角色中,您可以建立超过您任期的有价值的系统,但是您可以随身携带他们,也可以因其成功而获得持续的荣誉。赢得这场比赛,这表明我有能力创建自己的解决方案,而不仅仅是为别人的愿景做出贡献。我学到了企业角色的宝贵技能,但是我很高兴将它们应用于我深切关心的挑战。

我通过两种主要途径来追求这一点:咨询项目,以利用我的数据科学和机器学习专业知识,并建立AI语言学习产品。咨询工作可立即获得收入,并使我与实际的业务问题保持联系,而语言产品代表了我的长期愿景。我正在学习在公共场合建立并分享我的旅程通讯

作为一位会说九种语言的多语言,我深入思考了实现对话流利的挑战,而不仅仅是学习外语时的教科书知识。我正在开发一个AI语言学习伙伴,该合作伙伴可以帮助人们练习现实世界的场景和文化背景。

最让我兴奋的是建立考虑文化背景和对话差异的AI解决方案的技术挑战。在咨询方面,我通过与想要解决实际问题的公司合作而不是仅仅为了拥有AI而实施AI来激发人们的精力。无论是使用风险模型还是简化信息检索,我都喜欢域专业知识和实用AI相交的项目。

许多公司渴望与AI聊天,但不总是知道从哪里开始。您的典型过程有助于新的客户范围并确定其第一个AI计划的优先级?

我采用问题优先的方法,而不是使用AI解决方案。太多的公司想对AI努力做些事情,而没有确定他们试图解决的特定业务问题,这通常会导致令人印象深刻的演示,而不会动弹。

我的典型过程遵循三个步骤:

首先,我专注于问题诊断。我们确定具有可测量影响的特定疼痛点。例如,我最近与一家客户合作,在餐厅空间中,收入增长放缓。我们没有跳到AI驱动的解决方案,而是检查了客户审核数据以识别模式。例如,哪些菜单项会引起投诉,哪些服务元素产生了积极的反馈,哪些操作问题最频繁。该数据驱动的诊断导致了特定的建议,而不是通用AI实现。

其次,我们预先定义了成功。我坚持使用可量化的指标,例如节省时间,质量改进或收入增加。如果我们可以衡量它,我们可以证明它有效。这样可以防止范围蠕变,并确保我们解决了真正的问题,而不仅仅是构建酷技术。

第三,我们经过可行的解决方案,并在最佳方面保持一致。有时,这是一个可视化仪表板,有时是抹布系统,有时会增加预测能力。ai永远不会是答案,但是当它的答案时,我们确切地知道为什么要使用它以及成功的样子。

这种方法取得了积极的结果。客户通常会看到提高的决策速度和更清晰的数据见解。尽管我正在建立独立的实践,但专注于实际问题而不是AI流行语是客户满意度和重复参与的关键。

您是有抱负的数据科学家的指导者 - 您在试图闯入该领域的人们中看到的一个常见陷阱,以及如何建议他们避免它?

我看到的最大的陷阱是试图学习所有内容,而不是专注于一个角色。许多人,包括我很早就觉得自己需要参加每一个AI课程,并掌握所有概念,然后才能获得资格。

现实是,数据科学涵盖了非常不同的角色:从运行A/B测试的产品数据科学家到ML在生产中部署模型的ML工程师。您不需要成为所有事情的专家。

我的建议:首先选择您的车道。弄清楚哪个角色最能激发您的兴奋,然后专注于提高这些核心技能。我个人通过深入研究机器学习和进行真实项目的个人过渡到ML工程师(您可以阅读我的过渡故事这里)。我利用了我在信用和欺诈风险方面的领域专业知识,并将其应用于工程和业务影响计算。

关键是将这些技能运用到真正的问题上,而不会陷入教程地狱。我通过新闻通讯和指导不断看到这种模式。突破的人是那些开始建造的人,即使他们没有准备就绪。

AI角色的景观不断发展。新移民应该如何决定在哪里重点 - 完全是工程,数据分析,LLM或其他东西?

从您当前的技能以及您感兴趣的东西开始,而不是听起来最负盛名的内容。我曾在不同的角色(分析师,数据科学家,ML工程师)工作,每个角色都带来了宝贵的,可转移的技能。

这是如何处理决定的方式:

如果您来自业务背景:产品数据科学家角色通常是最简单的切入点。专注于SQL,A/B测试和数据可视化技能。这些角色通常重视业务直觉,而不是深厚的技术技能。

如果您有编程经验:考虑ML工程或AI工程。需求很高,您可以基于现有的软件开发技能。

如果您借鉴了基础架构:MLOPS工程需求量很高,尤其是随着越来越多的公司按大规模部署ML和AI模型。

景观不断发展,但如上所述,领域专业知识通常比遵循最新趋势更重要。我赢得了ML竞赛,因为我了解信用风险基本面,不是因为我知道最奇特的算法。

专注于解决您了解的领域中的实际问题,然后让技术技能遵循。要了解有关不同角色的更多信息,我写了有关5种类型的数据科学职业道路的文章这里

您认为应该写更多的人应该写的一个AI或数据科学主题是什么或您现在密切关注的一种趋势?

在模仿真实的对话模式和语气中,文本到语音(TTS)技术的速度和质量使我感到震惊。我认为更多的人应该写有关TTS技术的濒危语言保存。

作为对跨文化理解充满热情的多方面,我对AI如何帮助防止语言完全消失了。大多数TTS开发都集中在具有大量数据集的主要语言上,但是全球有7,000多种语言,许多语言有灭绝的风险。

让我兴奋的是,AI有可能为可能只剩下几百个说话者的语言创建语音综合。这是为人类和文化保护服务的技术!当一种语言死亡时,我们将失去对世界,特定知识系统和文化记忆的独特思考方式。

我密切关注的趋势是传递学习和语音克隆如何使这一技术可行。我们达到了您可能只需要数小时而不是数千个小时的音频数据即可为新语言创建高质量的TT,尤其是使用现有的多语言模型的地步。尽管这项技术引起了人们对滥用的有效关注,但语言保存等应用程序表明,我们如何负责以文化利益来负责任地使用这些功能。

当我继续开发我的语言学习产品并建立咨询实践时,我一直在提醒,最有趣的AI应用程序通常来自将技术能力与深入的领域理解相结合。无论是建造机器学习模型还是文化交流工具,魔术都会发生在交叉路口。


了解更多有关克劳迪娅的作品并与她的最新文章保持最新状态,您可以关注她TDS,,,,替代, 或者LinkedIn。一个 

关于《“我最大的教训是意识到领域专业知识比算法复杂性重要。”|迈向数据科学》的评论


暂无评论

发表评论

摘要

在作者聚光灯采访中,TDS编辑与AI企业家和数据科学家Claudia Ng讨论了职业道路,撰写灵感和成就,在金融科技领域拥有超过6年的经验。克劳迪娅(Claudia)最近在Web3信用评分ML比赛中排名第二,赢得了10,000美元。她强调了领域专业知识对算法复杂性的重要性,并分享了她从公司技术转向自由职业工作的见解,专注于构建AI语言学习产品。克劳迪娅(Claudia)建议有抱负的数据科学家专注于一个角色,而不是试图学习所有内容,并通过文化理解来强调TTS技术来保护濒危语言的潜力。