2024-07-26 16:50:58 Techweb
近日,据北京市网信办发布《北京市生成式人工智能服务新增已备案信息公告》,中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)自主研发的星辰语音大模型、星辰多模态大模型已通过备案,其中星辰语音大模型为国内首个独立备案的语音大模型。至此,星辰大模型系列的语义、语音、多模态大模型均已完成算法及服务的“双备案”,标志着星辰大模型可正式对外提供完备的全模态生成式人工智能服务。
北京市生成式人工智能服务已备案信息公告(7月20日)
TeleAI作为最早布局大模型的央企机构之一,在中国电信CTO、首席科学家、TeleAI院长李学龙教授带领下,坚持全链路自主研发创新,构建了语义、语音、视觉及多模态等全模态完备的大模型基础框架。基于星辰系列大模型的算法研究成果已在CVPR、ACM MM、ICCV等AI顶会/顶刊发表论文30多篇,并获得国际顶会AI竞赛冠亚军20多项。
星辰语音大模型是业界首个支持30种方言自由混说的语音识别大模型,打破单一模型只能识别特定单一方言的困境,降低开发门槛,实现单方言标注需求低至传统方案1%。当前,星辰语音识别及生成能力已广泛应用于12345市政热线、数字人、万号智能客服等领域,极大解决偏远地区信息服务无法触达和适老化沟通的问题。星辰语音大模型的模型、代码已全面开源,吸引企业、伙伴及开发者广泛讨论和使用,共建AI时代沟通的桥梁。
TeleAI组建了超30人的语音研发团队,核心骨干均来自头部互联网和AI明星企业,有丰富的研发和实践经验。凭借丰富创新技术积累和实践,星辰语音大模型获ICAGC 2024 高感染力与可信音频生成挑战赛、国际权威语音顶会INTERSPEECH 2024挑战赛、SLT2024的旗舰赛事 “源说话人溯源挑战赛”等诸多国际权威赛事冠军。
星辰多模态大模型基于AI内容生成技术,通过自然语言处理和视觉生成能力,具备高效易用与低成本等多种优势,可应用于广告营销、创意海报设计、形象设计、电影和动画等场景。星辰多模态大模型已面向近千万用户,提供个性化制作视频彩铃的图生图服务,在视觉创意设计领域,面向百万级智能云盘相册用户提供文生图、图生图、AI图片编辑等智能增值服务。
TeleAI多模态团队骨干均来自顶尖互联网企业和全球著名学府,兼具深厚的学术背景与实战经验,团队现已构建起TeleAI自主可控的多模态图像生成与图像编辑能力生态,在三大国际权威评测榜单T2I-CompBench评测、GENEval评测、HRS-Bench评测中,总体性能评分均对齐Midjourney ,性能处于国内多模态大模型前列。
TeleAI作为首个开源开放的央企机构,积极通过开源推动大模型技术进步和国产化进程。星辰语义大模型已接连开源1B、7B、12B、52B参数规模大模型,构建全尺寸开源格局,吸引国内外开源社区开发者广泛讨论和使用,开源模型下载量超1.3万。在国际权威评测榜单Opencompass,星辰百亿参数大模型整体性能评分已超过GPT3.5_Turbo水平,性能处于国内同级别参数模型前列。当前,星辰大模型已在政务服务、智慧城市、经营分析、公文写作等领域广泛应用落地。
此前星辰语义大模型已通过双备案 图源:5月15日北京市网信办公告
以科技创新为翼,以技术普惠为责。未来,TeleAI将持续加快创新步伐,大力推进星辰系列大模型性能提升,深入推动人工智能与各行各业的应用融合,为数字经济高质量发展注入央企动能。