× 關閉
關於南訊
Home   /   關於南訊   /   技術科普   /   大型語言模型(LLM)是什麼?
2023/11/29

大型語言模型(LLM)是什麼?

大型語言模型(LLM)

人工智能已經漸漸地深入到我們平常的日常生活中,而大型語言模型(large language modelLLM)則是其中一種具有很大影響力的人工智能技術,近期很熱門的   ChatGPT 就是其中的一種應用。

 

大型語言模型是透過大量的文本數據去訓練,試圖讓模型去學習並理解這些文本的模式和規則。通常,這些模型都包含了數十上百億的參數,這些參數都儲存了模型從文本數據中學習到的各種模式或規則,最終使其能夠在指定情境下產生出全新的文本、合理的回應或預測。

 

簡單來說,大型語言模型( LLM )就是人類在運用人工智慧時,讓電腦能夠理解人類語言的工具。其中,生活中最常見的基本應用包括

1.     文本生成 生成文章、詩詞、故事

2.     文本整理 整理得到的文本資料,可用來做知識庫回答、資料的分類、客戶情感的分析等

3.     翻譯 因為   LLM 能透過理解上下文來改善翻譯出來的文本,比起以往呆版的機翻更貼近原意

4.     智慧搜尋引擎與聊天機器人 –  LLM 使得這些以往就有的服務更智慧,精確捕捉到使用者的原意並提供他們想要的結果

5.     產生程式碼 目前應用上已經能根據自然語言提示來產生常用的程式碼,例如   PythonCJAVA 或   SQL 指令

 

雖然   LLM 技術的興起似乎只是近幾年的事情,但生活上已經有非常多的應用,未來隨著   LLM 數據的增長,可以預見   LLM 在生活上的應用也會越來越全面且人性化,並進一步改變我們的生活及工作型態。