![]() |
北京2025年6月10日 /美通社/ -- 本月,IBM 大幅简化企业数据堆栈,推出新软件,来统一、治理及激活驱动 AI 智能体和其他先进 AI 应用所需的非结构化企业数据。
两款新产品包括 IBM watsonx.data integration 和IBM watsonx.data intelligence。这两款产品的部分功能也将透过 IBM 混合开放式湖仓一体数据平台 watsonx.data 提供,实现以一致的体验来管理整个 AI 数据生命周期。
新软件采用混合且开放架构,能连接第三方数据堆栈,提供灵活性、互通性,并推动生态系统创新。根据 watsonx.data 测试,新产品可使 AI 精准度较传统 RAG 提升 40%。[i]
IBM 某客户近期利用转型升级后的 watsonx.data,使 7 万名工程师、科学家和技术人员能以自然语言从数百万份文件中检索答案和资讯。该客户资深副总裁表示:"我们正加速创新与快速提升效率,将解决方案从实验室带到现场,助力打造更安全、更稳固的世界。"
背景说明
企业需要生成式 AI,尤其是具智能体能力的 AI,以推动创新、释放生产力并保持竞争力。而生成式 AI 需要企业专属数据才能精确且高效。根据 IBM 最新 CEO 研究,有 72% 的商业领袖认为自有数据是发掘生成式 AI 价值的关键。
但这些珍贵数据多为非结构化,难以掌握,散落于电子邮件、PDF、简报及影片中。传统 RAG 无法处理非结构化数据的规模与复杂性,也无法妥善结合结构化数据。同时,众多分散工具令数据架构复杂且笨重。
因此,企业的非结构化数据(据 IDC,可能占其总数据量的比例高达 90%)大多未被充分利用,且未反映于其 AI 智能体及其他生成式 AI 应用中。
详细内容
Watsonx.data integration引入全新统一数据整合控制平台,旨在扩展 AI 就绪数据的交付。数据工程师可跨低代码、代码优先及智能体工具桥接,支持不同撰写入口。该软件协调多种整合方式间的数据流动,具备批次 ETL/ELT、大宗处理、即时串流、数据复制及数据可观察性功能,涵盖结构化与非结构化数据。其核心强调灵活与适应性,数据团队无需面对分散工具或因每次数据存储范式变革而增加技术负债,保障数据基础设施的未来弹性。
Watsonx.data integration将于 6 月 11 日起作为独立产品上市,其非结构化数据整合与可观察性功能亦可透过 watsonx.data 使用。
Watsonx.data intelligence改变了组织策划、管理及运用数据的方式,利用 AI 的力量简化跨混合生态系统的数据交付。该软件统一数据治理、品质、血缘及共享,赋能组织发现、信任并存取有意义的数据。
Watsonx.data intelligence将于 6 月 11 日起作为独立产品上市,其功能亦可透过 watsonx.data 管理湖仓中的数据。
更多的数据创新
继收购 DataStax 后,IBM将持续将其工具与技术整合至watsonx.data,包括 Astra DB 与Hyper-Converged Database,提供由开源 Apache Cassandra® 支援的 NoSQL 与向量资料库功能,预计 6 月 11 日推出。
6 月,IBM 将推出 watsonx BI,一款 AI 分析智能体,重新定义团队与数据互动的方式,利用自然语言释放卓越商业智慧。该智能体能在秒内回答市场、销售、运营、财务等领域问题,并提供逐步推理解释。Watsonx BI 将作为独立产品及透过 watsonx.data 提供。
IBM 近期宣布将 watsonx 作为 Meta Llama Stack 的 API 供应者,强化企业大规模部署生成式 AI 的能力,并以开放性为核心。Watsonx.data 的 Milvus 数据库已是 Llama Stack 框架的一部分,此整合将促进更多非结构化与结构化数据管理及智能体检索。
IBM 最近发布了企业级智能体 AI 工具,包括预构建的领域专属智能体、watsonx Orchestrate Agent Builder 及智能体式 AI 治理功能。搭配今日强大的数据产品,组织将拥有成功地大规模部署智能体式 AI 所需的数据与工具。
[i] 根据内部测试,比较使用 watsonx.data 检索层与仅向量 RAG 在三组常见文件集上的 AI 模型输出精准度,均使用相同开源通用推理、评判及嵌入模型及其他变数。 |