在您的技术堆栈中使用人工智能吗？准确性和可靠性是大多数人担心的问题 - The Register

在您的技术堆栈中使用人工智能吗？准确性和可靠性是大多数人担心的问题

大量生产应用程序，但需要进行测试来解决性能问题

研究人员发现，大多数将人工智能集成到技术堆栈中的公司都在急于追求性能以及由此产生的应用程序的可靠性问题。

无聊的应用程序并不是一个新现象，有许多流行的方法论和开发方法都可以归咎于质量的显着下降，但问题似乎越来越严重随着公司转向人工智能来创建应用程序，而没有充分考虑输出的质量。

Leapwork 发表的研究基于美国和英国 401 名受访者的反馈，指出虽然 85%已将 AI 应用程序集成到其技术堆栈中，68% 的人遇到过性能、准确性和可靠性问题。

401 名受访者中包括 201 名 C 级高管（CTO 和 CIO）以及 200 名技术主管（例如，IT 经理。）

近几个月来一些值得注意的中断是由于测试不足或不充分造成的，CrowdStrike 事件至少部分归因于网络安全公司的一些可疑做法，尽管人工智能可能被视为一种对于寻求提高生产力或削减成本（取决于您的观点）的公司来说，测试流程是灵丹妙药，测试流程也必须类似地发展。

根据研究，只有 16% 的公司认为他们的测试流程是高效的。

人工智能技术正在快速进入开发者世界。2024 年 4 月，Gartner 声称，到 2028 年，75% 的企业软件工程师将使用人工智能代码助手。

如果预测准确，这将比 2023 年初记录的 10% 大幅跃升.

也就是说，建议的质量令人担忧。Google 最近被发现索引了不准确的基础设施即代码示例，而许多组织已彻底禁止 LLM 机器人生成的代码。

Leapwork 已经为游戏带来了皮肤，它完全与测试自动化有关，并且已经成为当今的惯例。，一个“人工智能驱动的视觉测试自动化平台。”

然而，随着公司急于采用人工智能技术以期实现承诺的生产力提升，该报告提出了一些要点。Leapwork 首席技术官 Robert Salesas 表示：“尽管人工智能取得了诸多进步，但它仍然存在局限性，我认为人们很快就会认识到这一事实。

”人工智能实现的快速自动化可以显着提高产量，但如果没有彻底的测试，这也可能导致更多的软件漏洞，特别是在未经测试的应用程序中。”

确实可以。几乎三分之一 (30%) 的最高管理层表示，他们不相信他们的观点当前的测试流程将确保可靠的人工智能应用程序。

一种方法的目标是使用人工智能增强测试工具将人工智能作为测试的一部分。然而，尽管人们对他们的结果有一定的信任（64% 的高管受访者喜欢他们所看到的内容，而技术团队的这一比例为 72%），但仍保持谨慎态度。口号：68% 的高管认为人工验证仍然至关重要。

研究表明，轻率地投入人工智能辅助可能会导致生产出更多应用程序，但质量不稳定且不合适测试过程意味着开发人员需要考虑如何验证这些应用程序和集成。