2023 Meta最強開源LLMs: Llama2介紹 發佈留言 / 大型語言模型, 科技工具 / 作者: softaverse 觀看人次: 342 目錄Llama2是什麼基準測試Benchmarks結語 softaverse Llama2是什麼 Llama 2 (Large Language Model Meta AI 2)是Facebook母公司Meta於2023年7月推出的大語言模型們(Large Language Models, LLMs)。為什麼說是模型們呢?因為Llama 2包含了70億到700億參「pretrained」與「fine-tuned」出來的大語言模型們(LLMs)。例如其中的Llama 2-Chat是專門為了優化「對話」產生出來的模型。Llama 2的訓練資料比Llama 1多40%,並且有更長的上下文長度(Context Length: 4096),意味著可以一次「記憶」更長的對話內容。更重要的事情是,Llama 2是「開源」的大語言模型並且在大多數的商用都是免費的,儘管Llama 2因為部分使用限制被開源團體開放原始碼促進會抗議,Llama 2的使用限制對個人開發者以及中小企業來說影響不高。 基準測試Benchmarks 官方釋出的基準測試(Benchmarks)對比起它開源LLMs有更好的表現,以MMLU (Massive Multitask Language Understanding)為例,ㄗ在相同訓練資料量的情況下,表現都比其它LLMs來得更好。 結語 近期在開發LLM相關的產品,發覺用於生成的tokens越來越多,並且背景資料符合自己的使用案例,原本只是簡單使用openai的API快速串接,在必須符合自己的使用案例的情況下,簡單的API串接已經無法滿足我的需求,於是找到了開源的Llama 2可以滿足我的應用需求。預期Llama 2會寫一系列的文章,這篇文章只是個開頭,幫助你對Llama 2有個基礎認識也幫自己做學習紀錄,下一篇文章介紹LLM的一些使用案例與Demo,幫助大家獲得一些開發上的靈感與使用方式。 softaverse 喜歡運用科技工具提升工作效率、並自主開發實用小工具的長時間使用電腦工作者。對新科技工具深感興趣,樂於分享如何運用科技工具提升生活和工作效率的技巧。