海天瑞声获164家机构调查与研究:今年前九个月公司业务明显回升核心驱动力之一是海外客户的需求拉动尤其是在大模型驱动的背景下头部客户群体对AI的投入力度加大(附调研问答)

时间: 2024-11-22 19:57:20 |   作者: 产品展示

产品介绍

  

海天瑞声获164家机构调查与研究:今年前九个月公司业务明显回升核心驱动力之一是海外客户的需求拉动尤其是在大模型驱动的背景下头部客户群体对AI的投入力度加大(附调研问答)

  海天瑞声获164家机构调研:今年前九个月,公司业务明显回升,核心驱动力之一是海外客户的需求拉动,尤其是在大模型驱动的背景下,头部客户群体对AI的投入力度加大(附调研问答)

  海天瑞声11月20日发布投资者关系活动记录表,公司于2024年11月17日接受164家机构调研,机构类型为QFII、保险公司、其他、基金公司、海外机构、证券公司、阳光私募机构。 投资者关系活动主要内容介绍:问:从去年到今年,海外AI

  海天瑞声11月20日发布投资者关系活动记录表,公司于2024年11月17日接受164家机构调研,机构类型为QFII、保险公司、其他、基金公司、海外机构、证券公司、阳光私募机构。 投资者关系活动主要内容介绍:

  问:从去年到今年,海外AI大模型厂商和应用厂商对数据的需求情况如何?尤其是各大巨头的数据需求量和类型有何变化

  答:今年前九个月,公司业务明显回升,核心驱动力之一是海外客户的需求拉动,尤其是在大模型驱动的背景下,头部客户群体对AI的投入力度加大。我们服务的海外巨头客户中,包括IoT、社交、搜索和综合 性科技公司。IoT巨头在大模型上机方面表现突出,几家硬件巨头都在以不同的节奏推进其自身的智能化战略,这些战略在研发阶段就释放了数据需求。此外,受益于AI应用的逐步落地,有关数据需求体量也呈现增加趋势。

  答:客观上来看,在大模型时代,人机交互的方式日益丰富和多样化,语音交互是其中较为重要的交互方式之一。当前,从数据需求端来看,语音交互的需求正在上升,尤其是跨国公司在推广其AI硬件产品时,对多语言数据的需求呈现增长态势;此外,交互的输出端,即语音合成也在向着更加拟人化的方向发展,多情感、多角色、多音色的语音数据需求也在同步快速增加。往未来看,人机交互的最主要方式并非单一的语音交互,而是多种交互方式并存、一起发展的局面。语音交互作为其中的重要一环,将在未来继续发挥及其重要的作用,并与其他交互方式一起推动人机交互技术的不断进步。

  答:我们观察到在IoT硬件厂商的端侧应用中,数据需求呈现一些新的共性特点,包括但不限于语音转写、文档修饰、改写、生成摘要、短信自动回复、图片和视频自动处理等。此外,办公场景中的数据需求也在增加,例如通过OCR技术改进财务办公类应用的发票处理方面的数据需求等。

  答:尽管有声音认为大模型的数据源面临枯竭的风险,但从我们的业务角度来看,情况恰恰相反。尤其 是在垂直场景中,许多数据并不在网络上,一定要通过与众多垂域场景的数据持有方开展合作进行定向采集获得。过往近20年的创业发展历史中,海天瑞声在这方面积累了丰富的技术、资源、经验优势。此外,随着中央办公厅、国务院办公厅近期出台了《关于加快公共数据资源开发利用的意见》,我们始终相信国内公共数据资源领域的开发利用进程也将加速,预计将为AI训练提供大量新的数据来源。

  答:为更好把握行业机遇、逐步扩大全球客户辐射范围,公司从体系搭建、市场研究、品牌升级、营销推广等多维度提升业务、客户触达及服务能力。前三季度,公司持续加强境外销售团队建设,进一步织密客户服务网络;同时,通过参与包括WebSummitQatar、ICASSP、AIEXPOTOKYO、AutosenseandInCabin及CVPR等全球知名行业及学术顶会,以及布局搜索广告投放、社会化媒体矩阵等多类宣传渠道等方式,向全球市场展示公司先进的技术实力及创新产品,提升行业影响力和美誉度。2024年,公司全新发布海外官网,全面升级官网服务模式,通过搭建marketplace,便捷用户目标服务/产品的选择,有效提升新客户拓展以及订单转化率。

  答:目前来看,市场上数据服务市场主要由品牌数据服务商、客户自建团队以及一些中小数据服务商构成。 未来,公司预判整个数据服务市场将进行重新洗牌,集中度将逐步提升。市场各类主体将会通过在研发技术投入、资源能力建设等主要方面的竞争,逐 步淘汰掉那些研发能力弱、资源势力差的品牌服务商和中小玩家。此外,国家对于数据安全及合规要求的进一步趋严,会将那些不具备数据安全合规能力或尚未进行此方面布局的企业逐渐淘汰出局。 在客户自建团队部分,出于其自身对数据和业务的敏感性、保密性需求,可能会与品牌服务商长期共存。

  答:经过多年发展与积累,公司逐步构建起了在行业内的竞争壁垒,核心竞争力大多数表现在: (1)公司的业务模式是服务产品双模式,且产品化贡献显著,是收入和毛利的大多数来自,标准化数据集的研、产、销体系是公司从业多年探索出来的业务模式,其复用性为公司的规模化和高利润率提供了保障。而保持这样的能力需要具备对行业需求的强判断力和较强的资金实力。截至2024年6月末,公司已积累1,650个自有知识产权的训练数据标准化产品,数据库存量稳居全球企业前列。 (2)技术平台能力:公司历来重视技术的研发,近年来更是加大研发投入的力度,全方面提升公司的算法能力、平台能力、工程化能力,加深算法辅助能力与人工工作的结合,达到更佳的人机协同效率,这样子就能够做大规模、提升效率、减少相关成本。 (3)供应链资源管理能力:公司通过长期建设的供应链体系,保障资源的获取,未来,公司会促进加大供应链资源平台的建设,使人员管理、采标资源分配、质量检验、远程工作等各方面的能力得到非常明显提升,为客群拓展提供有力支撑。 (4)数据安全及合规能力:数据安全及合规能力 慢慢的变成了了衡量品牌数据服务商综合能力的重要指标。公司在多年数据风险识别和管理实践中,已形成了较为成熟的安全、合规管理体系。 公司全方位做好数据风险管控工作,通过了业内重要的ISO/IEC27001体系认证、ISO27701个人隐私信息安全管理体系认证,形成了具有自身特色的数据安全与隐私保护整体解决方案。此外,公司获得了北京市规划和自然资源委员会行政许可,获得乙级测绘资质;同时开展信息系统等级保护测评工作,获得等保三级备案证明;目前,公司符合GDPR、《数据安全法》、《个人隐私信息保护法》等一系列国际通用与国内法律和法规的管理规范要求,获得了业务领域合作客户的高度认可。

  答:拥有行业排名第一的自有知识产权训练数据产品集群是公司区别于众多竞争对手的显著优势,公司已 沉淀下超过1,650个自有知识产权的数据集产品,通过开发大量通用型、复卖率高的标准化产品数据集为公司的规模化和高利润率提供了保障。 训练数据定制服务是公司收入的重要来源,而且在提供训练数据定制服务过程中,公司会接触到很多类型的数据,帮助公司了解行业最新的技术路线和需求,同时,该等数据会在公司的采集加工平台上做处理,对公司的算法提升和平台的工程化能力都提供了很好的学习资源,是研发迭代的较强助力。

  答:智能终端侧的AIagent有望成为继智能驾驶之后 又一个重要的AI落地场景,预期会带来新型的数据需求。首先,智能终端agent需要可处理和理解来自终端场景的多样化数据,因此就需要获取例如终端设备中的照片、视频、以及短信和电子邮件内容,通过这一些数据的学习,使得AIagent能够深入解读和响应终端的文本和图像信息。其次,为了模拟和执行人类的操作行为,AIagent需要大量的各类应用的操作数据,来训练其对各类操作的过程的理解。此外,AIagent一定要能理解和响应各种语音输入,这也激发了对多语种、多音色和多风格语音数据的进一步需求。针对以上AIagent多样化的数据需求,海天瑞声均具备设计、采集、加工等数据服务能力。

  答:2024年前三季度,公司收入为1.50亿元,同比增长44.90%,主要是受益于大模型技术的快速发展以及应用场景不断落地,以智能终端厂商、科技互联网公司等为代表的国内外科技巨头纷纷加大多模态数据投入以支撑其智能终端、内容生成等领域的AI能力。由此带来,以多语种、多音色为代表的智能语音业务需求、以及以指令微调、偏好对齐为代表的自然语言业务需求均同比呈现大幅度增长,整体上驱动公司营业收入同比明显地增加。截至9月末,公司已为近20家境内外大模型企业、科研机构,在预训练、指令微调、偏好对齐等方面提供了训练数据服务或标准化产品,为后续承接更大规模的大模型领域数据需求奠定基础;

  丁骄琬、乔婧妍、刘双雨、卢虎、叶侃、吴春华、吴若男、孙锴、张思卓、张森贤、彭枚芳、彭燕、曹瀚文、朱志轩、杨俊涛、柴姝琳、湛美、牛烁衡、王献锋、苏杨、董瑞超、袁泽世、谌昕、谢春生、邱才修、邵劼、郑欣、郭雅丽、陈妙、高丽嵩

  Jie Xu、丁珊、于良涛、侯斌、刘姝仪、刘志敏、刘海啸、吴昊龙、周俊恺、周勤、周明飞、唐谷军、尹霄羽、崔帅、常宾、廖克銘、廖明兵、张一毅、彭博、彭少楷、彭飞虹、慕陶、曹棋、朱俊、朱辉、李强、李心宇、李斌、李梦帆、杨嘉、杨湘云、林仲晞、林楠、梁楠、涂俊辉、王志广、王磊、祁朝瑞、翁公羽、舒殷、范佳锴、蒋士杰、赖瑞萍、钟华、陈晖、陈桂、顾宝成、饶欣莹、马建、魏鑫、黄华艳