首页 > 技术

依图科技:引领人工智能技术的深潜与突破

2024-07-11 11:22:26      西盟科技资讯   


  在飞速发展的科技时代,依图科技以卓越的创新能力和前瞻性的国际视野,矗立于人工智能革命的前沿。作为技术创新的领航者,依图科技汇聚了一支由世界顶尖人才组成的研发团队,他们投身于人工智能的基础性科学研究,不断推动着技术的边界。

  依图科技深耕于破解机器视觉、听觉和理解等深层难题,致力于实现机器对世界的全面感知和深刻理解。通过不懈的努力和持续的创新,依图科技已经在人脸识别、语音识别、自然语言处理等多个关键技术领域取得了突破性进展,并确立了自己在全球范围内的领先地位。

  视觉+听觉+语言理解,构筑人工智能的技术堡垒

  在机器视觉领域,依图科技不断刷新领域新纪录,树立了全球标杆。在人脸识别技术上,公司连续两年三次荣获全球最具权威的竞赛(FRVT)冠军,确立了全球工业界实际应用的黄金标准。同时,依图科技在人体ReID技术上刷新了业界三大权威数据集的最优成绩(SOTA),通过AutoML技术取代了传统的人工算法调优。在行为识别方面,依图科技在ACM MM 2020 Grand Challenge“大规模复杂场景人体视频解析”挑战赛中荣获第一名,展现了其在复杂场景解析上的技术实力。

  在语音识别领域,依图科技拥有世界领先的算法,其识别精准度创造了语音识别的新高点。在全球最大的普通话测试AISHELL-2中,依图科技刷新了新纪录,相比原纪录提升了约20%,展现了其语音识别技术的先进性。

  声纹识别是依图科技的另一大亮点。公司的声纹技术在等错率上实现了大幅降低,一音辨人的准确度在全球权威声纹识别竞赛VoxSRC中荣获世界冠军,大幅领先第二位31%,破纪录夺冠,证明了依图科技在声纹识别领域的领先地位。

  自然语言理解是依图科技的另一重要研究方向。公司在该领域取得了重大研究成果,并成功落地应用,加速推进了产业智能化的进程。值得一提的是,依图科技的中文NLP技术在医疗领域的诊断成果被全球知名的《自然医学》(Nature Medicine)期刊刊发,这是该期刊首次刊发中文NLP在医疗领域的诊断结果,标志着依图科技在自然语言理解领域的研究达到了国际领先水平。

  依图天问大模型,强大的人工智能大生态

  不仅在视觉、声觉等领域深耕,依图科技作为多模态大模型领域的引领者,更是构建了一个全面且强大的人工智能生态系统。公司的场景应用广泛,覆盖了一网统管、智慧交管、智慧园区、公共安全、应急管理、智慧工地和智慧网店等多个领域,为不同行业提供了定制化的智慧解决方案。

  依图科技的服务能力全面,包括场景适应、零样本冷启动、持续对话、现场迭代、任务编排、语义搜索和语音调度等,这些服务不仅增强了系统的灵活性和响应能力,也极大地提升了用户体验。依图的产品线同样丰富多样,包括AI中台、图像围栏、训推一体机和边缘智脑等,这些产品通过集成先进的人工智能技术,为客户提供了高效、可靠的智能服务。在算法领域,依图科技涵盖了人车非识别、空间关系分析、人像聚档、属性分类、行为识别和万物搜索等,这些算法构成了公司技术实力的核心。

  特别值得一提的是依图天问大模型,它通过领域大模型预训练结合场景微调,实现了机器的思考、对话和进化,推动了人工智能技术向更高级别的发展。依图科技在视觉多模态领域的专注,实现了视频和语言模型的归一化,统一了物理世界和认知世界的底层框架,开启了视频情境理解的新时代。自2019年起,公司将基础训练模型迁移到Transformer架构,实现了从芯片到架构、算法、产品、场景的全栈优化,确保了技术的领先性和业务的广泛覆盖。

  在算力方面,依图科技通过算法芯片化,跨越了算力瓶颈,既追求极致性价比,又能够突破硬件部件的限制。依图科技成功打造了超融合大模型系统,并同步支持华为鲲鹏、昇腾等业界主流的高性能CPU/GPU服务器。此外,依图科技还推出了包括大模型训推一体机、边缘计算节点、大模型原子服务器、大模型聚档服务器、图像围栏应用系统、大模型视频语义搜索服务器、大模型推理布控服务器、大模型训练服务器在内的一系列创新技术,这些技术的推出进一步巩固了依图科技在人工智能领域的领导地位。

相关阅读