2023 Meta最強開源LLMs: Llama2介紹

發佈留言 / 大型語言模型, 科技工具 / 作者: softaverse

觀看人次： 342

目錄

Llama2是什麼
基準測試Benchmarks
結語
- - - softaverse

Llama2是什麼

Llama 2 (Large Language Model Meta AI 2)是Facebook母公司Meta於2023年7月推出的大語言模型們（Large Language Models, LLMs）。為什麼說是模型們呢？因為Llama 2包含了70億到700億參「pretrained」與「fine-tuned」出來的大語言模型們（LLMs）。例如其中的Llama 2-Chat是專門為了優化「對話」產生出來的模型。

Llama 2的訓練資料比Llama 1多40%，並且有更長的上下文長度（Context Length: 4096），意味著可以一次「記憶」更長的對話內容。更重要的事情是，Llama 2是「開源」的大語言模型並且在大多數的商用都是免費的，儘管Llama 2因為部分使用限制被開源團體開放原始碼促進會抗議，Llama 2的使用限制對個人開發者以及中小企業來說影響不高。

基準測試Benchmarks

官方釋出的基準測試（Benchmarks）對比起它開源LLMs有更好的表現，以MMLU (Massive Multitask Language Understanding)為例，ㄗ在相同訓練資料量的情況下，表現都比其它LLMs來得更好。

結語

近期在開發LLM相關的產品，發覺用於生成的tokens越來越多，並且背景資料符合自己的使用案例，原本只是簡單使用openai的API快速串接，在必須符合自己的使用案例的情況下，簡單的API串接已經無法滿足我的需求，於是找到了開源的Llama 2可以滿足我的應用需求。

預期Llama 2會寫一系列的文章，這篇文章只是個開頭，幫助你對Llama 2有個基礎認識也幫自己做學習紀錄，下一篇文章介紹LLM的一些使用案例與Demo，幫助大家獲得一些開發上的靈感與使用方式。

softaverse

喜歡運用科技工具提升工作效率、並自主開發實用小工具的長時間使用電腦工作者。對新科技工具深感興趣，樂於分享如何運用科技工具提升生活和工作效率的技巧。

發佈留言取消回覆

很抱歉，必須登入網站才能發佈留言。