西班牙巴塞羅那2026年3月12日 /美通社/ -- 在2026年巴塞羅那通信展期間,在由GSMA主辦的5G Futures Summit上,GSMA發布了《Gigauplink, Deterministic Latency, and Network Evolution for the Mobile AI Era》白皮書。白皮書定義了面向移動AI時代運營商原生話音業務的發展演進趨勢、應用場景和商業模式,并詳細闡述了AI Calling體驗評估規范,幫助運營商實現話音體驗建網,助力用戶話音業務的體驗躍升。
白皮書指出,在5G-A與AI的協同驅動下,移動通信進入到了移動AI時代,運營商的原生話音業務已從傳統話音演進到AI智能話音。如今,在原生IMS話音網絡基礎能力之上疊加AI算法和算力,傳統的語音通話正在向增強型服務和創新應用演進,為用戶帶來穩定、高清、可視、智能、高效的下一代通話體驗。這其中包括AI沉浸式通話、AI交互式通話等應用方向,這些新的AI通話服務對網絡連接能力和AI能力都提出了新的要求。
在白皮書中提到,AI降噪是AI沉浸式通話中的典型應用,通過AI算法消除不同場景下的環境噪音,使運營商的原生通話服務更加清晰,為用戶提供更加沉浸式的體驗。AI降噪算法可應用于辦公(>40分貝)、街道(>60分貝)和施工(>80分貝)等多種場景,使用戶無需依賴終端設備即可享受高質量的語音服務。AI增強的實時翻譯是交互式通話的典型場景,得益于話音網絡能力的增強,長期存在的語言障礙正在被打破?,F在,通過AI Calling可以在視頻通話中提供準確實時的語音轉錄或翻譯,這對于參與國際在線會議的商務人士、前往異國旅行的游客或聽力障礙人士來說,具有非常大的價值。
在商業模式方面,白皮書提到運營商可以通過嵌入AI能力,為傳統原生語音服務注入新功能新活力。用戶通過支付訂閱費用,即可在標準通話中享受AI驅動的增強功能,使運營商從單一的流量變現轉向多維度的體驗變現。
在AI Calling場景下,如何衡量用戶體驗是運營商面臨的新的課題。這次白皮書系統性的定義了AI Calling的體驗評估模型規范。AI Calling體驗評估模型規范在傳統高清話音三個體驗指標維度(QoE、QoS、覆蓋)的基礎上,疊加了AI沉浸式體驗、AI互動式體驗、QoI三個新的維度。其中,沉浸式通話場景可使基礎音通話體驗得到躍升,如可明顯感知的MOS提升、SNR增強等。交互式通話場景下網絡需要提供新的交互通道和能力,如通過DC(Data Channel, 數據通道)和VC(Video Channel, 視頻通道)能力,以實現屏幕共享、實時翻譯、座席交互等增強體驗。QoI是衡量話音網絡智能化程度的關鍵指標,這包括高質量的AI模型、靈活的AI管理能力、基于AI的網絡/用戶狀態感知與決策、普惠性AI服務能力等,是實現話音體驗躍升的網絡基礎保障。
當前,ITU已啟動一個名為P.AI-MOS的工作項目,用于評估多模態人工智能應用的用戶體驗,AI Calling語音體驗的提案也在研究之中?;诖耍珿SMA協同產業界呼吁共同推動體驗評測模型的發展,建立AI應用關鍵質量指標(KQI)與網絡關鍵性能指標(KPI)之間的映射規則,加速移動AI業務體驗標準的落地,從而更好地支撐移動AI產業的發展。