關於南訊
Home
/
關於南訊
/
技術科普
/
大型語言模型(LLM)是什麼?
2023/11/29
大型語言模型(LLM)是什麼?
大型語言模型(LLM)
人工智能已經漸漸地深入到我們平常的日常生活中,而大型語言模型(large language model,LLM)則是其中一種具有很大影響力的人工智能技術,近期很熱門的 ChatGPT 就是其中的一種應用。
大型語言模型是透過大量的文本數據去訓練,試圖讓模型去學習並理解這些文本的模式和規則。通常,這些模型都包含了數十上百億的參數,這些參數都儲存了模型從文本數據中學習到的各種模式或規則,最終使其能夠在指定情境下產生出全新的文本、合理的回應或預測。
簡單來說,大型語言模型( LLM )就是人類在運用人工智慧時,讓電腦能夠理解人類語言的工具。其中,生活中最常見的基本應用包括:
1. 文本生成 – 生成文章、詩詞、故事
2. 文本整理 – 整理得到的文本資料,可用來做知識庫回答、資料的分類、客戶情感的分析等
3. 翻譯 – 因為 LLM 能透過理解上下文來改善翻譯出來的文本,比起以往呆版的機翻更貼近原意
4. 智慧搜尋引擎與聊天機器人 – LLM 使得這些以往就有的服務更智慧,精確捕捉到使用者的原意並提供他們想要的結果
5. 產生程式碼 – 目前應用上已經能根據自然語言提示來產生常用的程式碼,例如 Python、C、JAVA 或 SQL 指令
雖然 LLM 技術的興起似乎只是近幾年的事情,但生活上已經有非常多的應用,未來隨著 LLM 數據的增長,可以預見 LLM 在生活上的應用也會越來越全面且人性化,並進一步改變我們的生活及工作型態。