松下推出 "OmniFlow" 多模态生成AI实现文本、图像与音频的自由转换

作者

2025-06-05

36次阅读

人工智能

松下控股公司联合美国松下研发公司(PRDCA)及加州大学洛杉矶分校(UCLA)成功开发多模态生成AI "OmniFlow"，实现文本、图像、音频任意对任意转换。该技术通过灵活结合针对不同数据格式的生成AI，解决了传统方法数据获取局限，在小样本情况下也能学习高精度模型，显著降低数据采集成本。OmniFlow的技术创新在于连接和处理三种不同数据特征，提升表达能力。实验显示，在文本转图像/音频任务中表现优异，所需训练数据量可减少至1/60。该技术将在CVPR 2025上展示。未来有望应用于工厂、生活方式等领域。松下控股将继续推动AI社会化应用。