獲獎殊榮
愛吠的狗憑藉自主研發的 GPU 加速 SIP / RTP 即時語音客服系統,在嚴格的技術審核中脫穎而出,正式獲選為 NVIDIA GTC 2026 官方海報。
該技術建構於 NVIDIA NeMo、TensorRT-LLM 與 Riva 之上,可直接運行於標準 SIP / RTP 電話通訊架構。此次入選不僅代表技術成果登上全球 AI 技術交流的重要舞台,也展現公司在 GPU 加速語音互動架構上的研發實力與創新能力。
技術亮點
NVIDIA 技術專家指出,愛吠的狗的系統在即時語音處理與工程設計上展現出高度整合能力與實務應用價值:
- 僅需一張 RTX 5070 Ti 或 RTX 5090 GPU,即可在裝置端完成語音辨識(ASR)、大型語言模型推理(LLM)與語音合成(TTS)。
- 系統端對端對話延遲約 530 毫秒,可透過 SIP / RTP 提供自然且接近真人對話的即時語音互動。
- 採用非侵入式「bypass」RTP 鏡像架構,可在不中斷既有通訊服務的情況下進行 AI 分析與監控。
- 整合 NeMo ASR、TensorRT-LLM 與 Riva TTS,打造專為電話通訊場景優化的 GPU 推理管線。
產業應用
此技術主要應用於電信與企業通訊場景,並具備廣泛的商業化潛力:
- 智慧客服系統:提供即時 AI 語音互動,提升客服效率與服務品質。
- 企業本地端 AI 部署:透過消費級 GPU 即可運行完整語音 AI 系統,降低對雲端運算的依賴。
- 生成式 AI 語音代理:結合語音生成與語意理解能力,打造更智慧的企業通訊服務。
未來展望
「挺進 AI 最高殿堂!」此次登上 NVIDIA GTC 2026 官方海報舞台,代表愛吠的狗在 GPU 加速即時語音客服系統上的技術成果獲得國際肯定,也顯示其工程設計已具備可被全球開發者與產業夥伴採用的成熟度。
公司將持續深化 GPU 加速語音互動技術,聚焦於低延遲、高安全性與可私有化部署的AI通訊架構,協助企業在不依賴雲端基礎設施的情況下,建置具備生成式 AI 能力的語音服務系統。透過在裝置端整合 ASR、LLM 推理與 TTS 的完整處理流程,企業可利用消費級 GPU 建立高效能的 AI 語音代理,大幅降低導入成本,同時確保資料安全與通訊即時性。
隨著生成式 AI 與即時通訊需求持續成長,愛吠的狗也將進一步拓展該技術在電信、客服中心與企業通訊平台等場景的應用,推動 AI 語音代理成為企業數位通訊基礎架構的重要組成,並加速其在國際市場的實際部署與規模化應用。