松下推出 "OmniFlow" 多模态生成AI实现文本、图像与音频的自由转换

作者
2025-06-05
3次阅读
人工智能
文章详情

松下控股公司联合美国松下研发公司(PRDCA)及加州大学洛杉矶分校(UCLA)成功开发多模态生成AI "OmniFlow",实现文本、图像、音频任意对任意转换。该技术通过灵活结合针对不同数据格式的生成AI,解决了传统方法数据获取局限,在小样本情况下也能学习高精度模型,显著降低数据采集成本。OmniFlow的技术创新在于连接和处理三种不同数据特征,提升表达能力。实验显示,在文本转图像/音频任务中表现优异,所需训练数据量可减少至1/60。该技术将在CVPR 2025上展示。未来有望应用于工厂、生活方式等领域。松下控股将继续推动AI社会化应用。