人工智能数据管理:AI商业化的“强制性课程”
行业新闻| 浏览量:0| 2025-09-09 08:30:05 |

摘要:2018年,中国的数据量为7.6 ZB,占全球总数的23.4%,预计到2025年将增加到48.6 ZB,占全球总数的27.8%,每年的复合增长率为30.35%。

中国经济先驱报,中国战略新兴行业杂志,中国发展网络记者杜尚

目前,人工智能市场的发展仍然很炎热,各行各业中对数据的需求也显示出蓬勃发展的趋势。但是,许多企业中的大多数非结构化数据不能用于AI(人工智能)模型培训,并且需要大量的手动标记。如果人工智能公司希望降低成本并提高数据注释的效率,则必须选择更有效,更好的体验注释工具来提高注释团队的工作效率。

在2021年中国国际服务贸易展期间,Yuntest数据发布了“云测试数据注释平台-AI数据集管理系统”,重点是上传,管理,存储,AI数据集的共享以及数据类型的标签管理。它还支持功能,例如存储标签结果和标签结果的可视化,从而帮助企业管理数据并提高数据培训的匹配程度。作为领先的AI培训数据服务提供商,Yuntest Data总经理Jia Yuhang在与记者的独家访谈中说,只有通过有效管理大量培训数据,我们才能减少冗余数据并最大程度地提高培训数据的价值,从而促进有序的开发和有效利用数据元素。

数据服务已成为人工智能商业化的基石。在人工智能产业链中,算法,计算能力和数据共同构成了技术发展的三个核心要素。从人工智能产业链的发展和未来发展趋势的发展来看,中国人工智能数据服务行业的市场规模正在逐渐扩大。

根据IDC的预测,中国的数据量的增长率最快,平均年增长率比世界快3%。 2018年,中国的数据量为7.6 ZB,占全球总数的23.4%,预计到2025年将增加到48.6 ZB,占全球总数的27.8%,年复合增长率为30.35%。在数据增长的背景下,数据资产管理的重要性是不言而喻的。

如今,各行各业都在快速的数字化转型列车上,以获得市场竞争力。值得注意的是,尽管企业正在投资数字化转型意图,但一些中小型企业也面临着当前“无法改变,无法改变并且不大胆改变”的情况。相关数据显示,目前,我国只有25%的企业进行了数字化转型,而中小型企业的比例甚至更小。

Jia Yuhang认为,数字化转型的本质是使用数字手段,例如软件技术,互联网和人工智能来降低企业运营成本,提高生产和运营效率,并为开源和客户扩展创造更多价值。正是由于这种情况,企业的数字转换不可避免地与信息基础架构(例如应用程序,软件和系统的构建和应用)是不可避免的,并且不可避免地会生成大量数据。

“越来越多的人工智能公司意识到,高质量的培训数据越高,AI的应用效果越准确,但这并不意味着其产生的价值就越大。” Jia Yuhang说:“在人工智能的商业化时代,企业面临着大量其自己的AI数据的一般困境,很难为特殊问题的情况找到有价值的AI数据。与此同时,在人工智能数据培训的过程中,AI数据管理面临的新挑战面临着不充分利用数据管理的新挑战。

在Jia Yuhang的观点中,AI数据服务在整个企业的数字化转型中起着基石和基础作用。 “帮助算法提高准确性的必要方法是培训数据。尽管消费者很快就不会注意到培训数据,但是一些酷炫的人工智能产品(例如自动驾驶汽车)不能没有算法,而算法在没有相应的高级训练数据的情况下就无法做到。”

AI数据集管理系统中的数据服务疼痛点的存在,使企业能够实现“随身携带的数据”,这也表明该行业已经迎来了新的机会。

云测试数据标记平台- 此次发布的AI数据集管理系统是行业中第一个专注于AI数据集的管理系统。它是基于人工智能行业的前瞻性发展的云测试数据的具体技术产品。 Jia Yuhang介绍了它可以帮助企业系统解决数据资产管理问题,例如数据存储,数据检索,数据资产许可管理,标签结果可视化等。

“人工智能的培训数据可以被视为一本教科书,使算法更准确。实际上,人工智能算法从原始瀑布发展到敏捷的发展。整个数据中对瀑布的投资的投资是异步的。但是,当算法发展到更深的领域时,重新贴上标签和重新培训。 Jia Yuhang告诉记者。

“在使用该系统的过程中,企业将有'搬进袋子'的经验。” Jia Yuhang告诉记者,这次启动该平台已经结合了AI数据服务的过程,并将其变成了产品。现在,最初用于管理云测试数据的服务过程现在可以扩展到与AI相关的企业。结合云测试数据标记平台,客户可以在一站式和流程中进行数据收集,数据标记和数据管理。

Jia Yuhang告诉记者,独立开发的云测试数据标签平台为与AI相关的公司提供了一站式和大规模的培训数据处理,这可以帮助提高AI数据培训的全面效率200%,并将标签精度提高到99.99%。

积极扩大数据管理市场应用的深度和广度。随着人工智能渗透到许多行业中,例如自主驾驶,智能医疗保健和智能教育,AI算法越来越多地要求培训数据维度和样本复杂性,对数据注释技术提出了挑战,标记平台功能以及来自不同维度的数据注释。

“作为AI技术的三个主要要素之一,数据基本上决定了人工智能的实施水平。一般而言,标记数据的准确性越准确,数据量越大,模型越好,最终的AI产品效应就越好。” Jia Yuhang对未来充满信心。他告诉记者,随着许多国家政策的引入,AI培训数据的增长率将非常迅速,市场前景将有良好的前景。

在人工智能潮流中维持技术和行业领导并不容易。 Jia Yuhang还揭示了其发展的秘密,即“水平和一个垂直”策略。

谈到“ Yiheng”时,Jia Yuhang向记者解释说:“随着整个人工智能的发展,我们在许多行业中都有端到端的培训数据服务解决方案,例如自主驾驶,智能家庭,智能城市,智能城市和智能融资。越来越多的工业来实现智能和数字化,我们将积极地为这些潜在的智能制定了智慧的技术,以帮助他们提供更多的人工智能。

“'一个垂直'更多地是关于对流行行业和技术的发展趋势的前瞻性预测,预先准备相关的工具链和数据服务能力,并确保有足够的准备以应对新的AI数据需求。”贾元说。

“人工智能已包含在新基础设施的新技术基础设施中,并且将会有更多的资本或政策关注,而数据(人工智能的三个要素之一)将不可避免地随着人工智能行业的增长而不可避免地增长。” Jia Yuhang告诉记者。



复制成功
咨询电话: 15595696085

扫下方二维码添加微信好友
我知道了
咨询