全部新闻
研究人员测试机器学习通过眼球追踪揭示人格特征的潜力
发表在 PLOS ONE 上的一项研究发现,机器学习系统可以利用眼球运动数据来预测青少年的某些性格特征,其准确性略高于偶然性。该研究重点关注大五人格模型和黑暗三人格特征,将马基雅维利主义和外向性确定为最可预测的特征。该研究使用自我报告问卷和眼球追踪设备收集了 35 名俄罗斯青少年在博物馆参观和走廊行走期间的数据。朴素贝叶斯和 Adaboost 等机器学习算法在预测某些人格特征方面的准确率高达 48%,这表明使用眼球追踪作为自然环境中评估人格的替代方法的潜力。
人工智能将比人类更好地理解人类
斯坦福大学心理学家 Michal Kosinski 在研究了 Facebook 的数据利用方法后,将他的研究重点转向了人工智能,特别是像 OpenAI 的 GPT-4 这样的大型语言模型 (LLM)。他在《美国国家科学院院刊》上发表的最新论文表明,法学硕士可能已经发展出一种类心智能力理论,作为提高语言技能的意外结果。Kosinski 通过向 AI 模型提出经典问题来对此进行测试,发现虽然 GPT-4 的表现水平与 6 岁儿童相当,但在某些领域仍然失败。他警告说,这些进步可能使人工智能系统能够更好地教育、影响和操纵人类,引发人们对社会对日益复杂的人工智能技术做好准备的担忧。
人工智能模型取代芒果快时尚广告中的真人
西班牙快时尚零售商 Mango 在其广告活动中使用人工智能生成的头像来取代一些人类模型,旨在更快地创建内容。这些数字模特所穿的服装是真实的并且可以购买。为了与 Zara 和 H&M 等竞争对手竞争,Mango 计划在其女装和男装系列中扩大人工智能技术的使用。其他品牌如Levi Strauss & Co、Louis Vuitton、Nike也因成本优势而与AI建模公司合作。此外,人工智能还帮助 Mango 设计系列并提供面料灵感。尽管发生了这一转变,Mango 仍继续创造就业机会,计划到 2025 年将其美国劳动力数量增加一倍,同时将其门店数量扩大到当年年底的近 70 家。
苹果开始推出人工智能,对假期前景持谨慎态度
《金融时报》提供各种订阅计划,包括每月 5800 日元的标准数字版(提供基本访问)、每月 9000 日元的高级数字版(包含专家分析)以及为组织提供独家内容的 FT 专业版。按年付款可享受折扣。试用订阅价格为 100 日元起,为期四个星期。
思科未包含在 Nvidia AI 企业参考架构 – 块和文件中
思科推出了基于 Nvidia 的 GPU 服务器(UCS C885A M8),用于 AI 工作负载和旨在简化 AI 基础设施部署的 AI POD,但这些不符合 Nvidia 的企业参考架构要求,因此思科没有被 Nvidia 列为合作伙伴。AI POD 缺乏人工智能推理不可或缺的存储组件,目前提供与 Pure Storage 或 NetApp 解决方案的可选集成,这可能会误导那些期望从单一供应商获得完整融合基础设施产品的客户。
人工智能车库门之谜
在 The Vergecast 的最新一集中,主持人和嘉宾乔安娜·斯特恩 (Joanna Stern) 讨论了智能家居技术的现状,特别关注苹果即将推出的硬件计划以及它们如何解决现有问题。对话还深入探讨了人工智能的新发展,包括 ChatGPT 最近推出的搜索引擎及其对谷歌的潜在影响。此外,该节目还涵盖了 Apple 最新发布的 Mac 产品,分析了设计变化及其对用户的意义。本集以闪电般的回合结束,涵盖 Netflix 的社交媒体整合和托尼·法德尔 (Tony Fadell) 对人工智能技术的看法等话题。
面向商业应用的多模式人工智能搜索
提供的文本描述了多模态嵌入模型的实现,该模型集成了用于问答、图像检索和跨模态搜索等任务的文本和视觉信息。以下是该文档要点的摘要:1. **设置和安装**:- 环境设置包括安装必要的 Python 包,如“transformers”、“langchain”等。- 使用 Hugging Face Transformers 库加载嵌入和模型。2. **为 LLM 输入准备节点**:- 图像节点和文本节点是根据文件中的元数据(例如“.jpg”或“.png”)准备的。- 提取文本内容并对其进行格式化,以创建提示的上下文字符串,从而通过相关信息增强问答任务。3. **快速工程和响应处理**:- 提示模板(`qa_tmpl`)用于格式化用户查询以及检索到的上下文。- 使用“完整”方法调用多模式法学硕士,以根据文本和视觉输入生成响应。- 响应的后处理包括提取输出中提到的相关图像路径。4. **显示结果**:- 辅助函数“display_images”将给定图像与检索到的匹配项一起绘制以进行视觉验证。- 代码展示了针对多模式模型运行不同类型查询的各种示例(例如,搜索带椅子的木制餐桌、办公桌)。5. **图像到图像检索**:- 演示如何使用输入产品图像从数据库/目录中检索类似图像。- 包括显示功能来显示给定和检索的图像以进行比较。6. **结论和进一步应用**:- 该系统在文本到文本、文本到图像和图像到图像检索等各种任务中被评估为有效。- 讨论了潜在的商业应用,例如个性化推荐、内容审核、跨模态搜索引擎等,强调模型的通用性和实用性。### 要点- **多模态嵌入**:系统的核心是多模态嵌入模型,可以有效处理文本和图像数据。- **LLM 集成**:通过将 LLM 与嵌入相结合,系统可以通过上下文图像增强复杂的问答功能。- **视觉验证**:检索和显示相关视觉内容以及文本响应的能力可增强用户体验并验证查询结果。### 未来的方向该实现建议进一步探索大规模多模式检索系统,以处理涉及大量文档和不同数据类型的复杂查询。这为丰富的客户服务自动化、个性化推荐和先进的知识管理工具等领域开辟了可能性。有关详细的代码参考和完整的实现细节,作者建议查看文章末尾链接的 GitHub 存储库。
今天就可以开展 5 个可盈利的人工智能业务
人工智能正在从新颖性转变为必需品,为各个领域的早期采用者创造了机会。Insidr.ai 创始人 Lasse Linnes 确定了 2024 年五种可盈利的 AI 商业模式:创办 AI 自动化机构、提供 AI 营销服务、提供 AI 聊天机器人服务、开发 AI 内容创建服务以及创办 AI SaaS 公司。每个模型都利用人工智能来优化运营、增强客户参与度并提供跨行业的可扩展解决方案。
为什么谷歌新任 Android 副总裁表示“人们不想听到人工智能”
2024 年,智能手机制造商开始将生成式人工智能更加突出地集成到他们的设备中,其中三星、谷歌和苹果处于领先地位。尽管存在这种趋势,Android 平台副总裁 Seang Chau 指出,消费者对人工智能本身的兴趣不如对其实际应用的兴趣。他强调了关注人工智能如何帮助用户的重要性,而不仅仅是强调人工智能技术。Chau 设想未来的“主动”人工智能能够更无缝地跨应用程序执行任务。随着智能手机销量下降,需要人工智能来重振消费者对手机的兴趣。然而,调查显示,许多消费者认为当前的人工智能功能没有帮助。随着生成式人工智能的改进并赢得用户的信任,它可能成为一种不可或缺的工具,有可能改变人们与设备交互的方式。
国际内幕:分析人工智能;AFM 飞往维加斯;东京物语
本周国际娱乐业出现了重大活动,特别是在制作公司收购领域:1. **ITV Studios 收购 Eagle Eye Drama**:ITV Studios 收购了 Walter Iuzzolino 的 Eagle Eye Drama,这是一家专注于制作可回收和可销售内容的制作公司,例如《波托菲诺酒店》和《T 教授》。此举对于 ITV 来说具有战略意义,因为它旨在通过可靠且具有商业可行性的节目来增强其产品组合。2. **索尼影视电视收购 Hot Sauce**:索尼影视电视收购了由 Declan Lawn 和 Adam Patterson 创立的新品牌 Hot Sauce,他们是 BBC 非常成功的电视剧《蓝光》的创作者。此次收购使索尼在戏剧市场占据一席之地,同时为其稳定的阵容增添了知名编剧。3. **All3Media 的潜在举措**:在 MIPCOM 期间,All3Media 老板 Jane Turton 暗示未来几个月或几年内可能进行收购或推出新品牌,让业界猜测哪些制作公司可能会受到她的关注。其他值得注意的亮点:- **TIFF(东京国际电影节)**:今年的 TIFF 的重点是保护电影遗产并通过日本和意大利等国家之间的联合制作条约促进国际合作。该节日还与洪金宝、仓田康明和谷垣健二等武术传奇人物进行了讨论。- **Breaking Baz**:安德鲁·劳埃德·韦伯的新音乐剧《魔术师》由杰米·劳埃德(因《日落大道》而闻名)执导,将成为未来几周的议程。- **Netflix 内容**:这家流媒体巨头已经从爱丁堡边缘艺术节找到了下一个热门项目,一个名为“天气女孩”的节目。- **监管新闻**:英国监管机构 Ofcom 因违反监管规定对 GB News 处以 10 万英镑罚款,凸显了媒体监管和合规方面持续存在的问题。这些发展凸显了国际娱乐业的动态本质,主要参与者积极寻求通过收购和战略合作伙伴关系来加强其投资组合。