多模態語言模型訓練技術

產出年度

2025

現況描述

可針對特定領域的多模態數據(如語音、影像)進行專門的語言模型訓練,使其能夠理解並處理多種數據格式。透過訓練影像與語音語言模型,提升模型對跨模態資訊的理解能力,從而實現更精確的語義解析與應用。

可應用範圍

多模態模型訓練

所需軟硬體設備

Docker、GPU

需具備專業人才

機器學習、自然語言處理、影像處理、語音處理

聯絡資訊

軟體技術研究院

楊又權

(02)6607-2519

ycyang@iii.org.tw