Meta Llama 3 正式发布!如何在线体验和本地安装部署?

Meta 宣布推出下一代开源大语言模型Llama 3,标志着AI发展新里程碑。该模型分为80亿和700亿参数两个版本,被誉为”Llama 2的重大飞跃”,为大规模语言模型树立新标杆。

值得一提的是,Llama 3已与Meta AI助手深度集成,未来还将陆续在AWS、Databricks、Google Cloud等多个云平台上线,并获得AMD、Intel、NVIDIA等硬件厂商的支持,进一步扩大应用场景。

该模型的发布彰显了Meta在开源AI领域的决心和影响力。我们有理由期待,Llama 3将为自然语言处理、机器学习等AI前沿技术的发展注入新动力。

在线使用:【链接直达

不仅可以智能对话,也可以在线生成图片

图片[1]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客 图片[2]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客

 

本地安装部署:

1.从github下载Llama 3 项目文件

点击下载】、【网盘下载

2.申请模型下载链接 (申请秒过)

点击申请

申请后会在邮件里提供一个下载链接

3.安装环境依赖

在Llama3最高级目录执行以下命令(建议在安装了python的conda环境下执行)

pip install -e .

4.下载Llama3模型,执行以下命令:

bash download.sh

 

运行命令后在终端下输入邮件里获取到下载链接,并选择你需要的模型,比如我选择8B-instruct

图片[3]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客

 

如果你在下载的时候出现这个错误,那是因为你电脑上没有安装Wget命令的环境,你只需【下载wget】、或【网盘下载

下载以后把wget.exe程序放在C:\Windows\System32 目录下就可以解决!看零度视频里的演示即可

 

图片[4]-Meta Llama 3 正式发布!如何在线体验和本地安装部署?-零度博客

5. 运行示例脚本,执行以下命令:

torchrun --nproc_per_node 1 example_chat_completion.py \
    --ckpt_dir Meta-Llama-3-8B-Instruct/ \
    --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model \
    --max_seq_len 512 --max_batch_size 6

 

6.创建自己的对话脚本,在根目录下创建以下chat.py脚本

# Copyright (c) Meta Platforms, Inc. and affiliates.
# This software may be used and distributed in accordance with the terms of the Llama 3 Community License Agreement.

from typing import List, Optional

import fire

from llama import Dialog, Llama


def main(
    ckpt_dir: str,
    tokenizer_path: str,
    temperature: float = 0.6,
    top_p: float = 0.9,
    max_seq_len: int = 512,
    max_batch_size: int = 4,
    max_gen_len: Optional[int] = None,
):
    """
    Examples to run with the models finetuned for chat. Prompts correspond of chat
    turns between the user and assistant with the final one always being the user.

    An optional system prompt at the beginning to control how the model should respond
    is also supported.

    The context window of llama3 models is 8192 tokens, so `max_seq_len` needs to be <= 8192.

    `max_gen_len` is optional because finetuned models are able to stop generations naturally.
    """
    generator = Llama.build(
        ckpt_dir=ckpt_dir,
        tokenizer_path=tokenizer_path,
        max_seq_len=max_seq_len,
        max_batch_size=max_batch_size,
    )

    # Modify the dialogs list to only include user inputs
    dialogs: List[Dialog] = [
        [{"role": "user", "content": ""}],  # Initialize with an empty user input
    ]

    # Start the conversation loop
    while True:
        # Get user input
        user_input = input("You: ")
        
        # Exit loop if user inputs 'exit'
        if user_input.lower() == 'exit':
            break
        
        # Append user input to the dialogs list
        dialogs[0][0]["content"] = user_input

        # Use the generator to get model response
        result = generator.chat_completion(
            dialogs,
            max_gen_len=max_gen_len,
            temperature=temperature,
            top_p=top_p,
        )[0]

        # Print model response
        print(f"Model: {result['generation']['content']}")

if __name__ == "__main__":
    fire.Fire(main)

运行以下命令就可以开始对话:

torchrun --nproc_per_node 1 chat.py     --ckpt_dir Meta-Llama-3-8B-Instruct/     --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model     --max_seq_len 512 --max_batch_size 6

 

THE END
喜欢就支持一下吧
点赞2176 分享
白嫖日本网盘!永久45G,速度超快,支持 WebDav 协议的 InfiniCloud, 赶紧上车!-零度博客

白嫖日本网盘!永久45G,速度超快,支持 WebDav 协议的 InfiniCloud, 赶紧上车!

InfiniCloud是一款非常不错的日本网盘,不仅速度快,而且还支持 WebDAV 同步! 官网:https://infini-cloud.net 即使你在大陆也无需翻墙即可访问网盘。 免费用户默认 20G 永久空间,输入注册码...
admin的头像-零度博客admin
01.4W+6541
永久免费使用谷歌云,Google Cloud到期后继续使用的方法!-零度博客

永久免费使用谷歌云,Google Cloud到期后继续使用的方法!

之前分享的视频教程《永久免费申请谷歌云 | 搭建SS,V2ray或trojan来进行翻墙 | 科学上网爽歪歪》中提到,申请谷歌云服务器,你必须要有一张visa的信用卡,就可以申请Google Cloud的300美金一年...
FFmpeg 安装教程!超详细,手把手详解整个设置过程-零度博客

FFmpeg 安装教程!超详细,手把手详解整个设置过程

一、下载官方的FFmpeg 访问 FFmpeg的官网链接:https://ffmpeg.org ,然后点击右侧的下载按钮。 然后找到适合自己系统的版本,比如我选择 Windows 版,如下所示 接着点击下方的第一个链接: 进...
admin的头像-零度博客admin
2.6W+2183
太震撼了!AI 修复模糊不清的视频、图片,【CodeFormer】效果最好!免费开源,附上完整的安装使用教程 | 零度解说-零度博客
Windows 11 支持的英特尔处理器-零度博客

Windows 11 支持的英特尔处理器

支持升级安装到windows 11的英特尔CPU 列表: Intel® Atom® x6200FE Intel® Atom® x6211E Intel® Atom® x6212RE Intel® Atom® x6413E Intel® Atom® x6414RE Intel® Atom® x6425E In...
Webtorrent 免费开源,且支持“边下边播”的BT种子下载工具!-零度博客

Webtorrent 免费开源,且支持“边下边播”的BT种子下载工具!

Webtorrent官方网站:https://webtorrent.io/desktop/ 适用于 Mac、Windows 和 Linux 的流式 Torrent 客户端 获取 WebTorrent 桌面 WebTorrent Desktop 用于流式传输种子。无论是来自Internet A...
加密货币提现教程,比特币、以太坊、狗狗币、门罗币等变现就这么简单!2021 | 零度解说-零度博客
Win11/Win10 惊爆多款限时免费应用,先到先得!-零度博客

Win11/Win10 惊爆多款限时免费应用,先到先得!

  Win11/Win10 应用商店思维导图软件 Mind Maps Pro 限时免费领取,原价 144 元,现在完全免费获取,先到先得。   免费活动时间:7月1日 — 7月3日 (2021年)   据IT之家网友反...
admin的头像-零度博客admin
11.1W+652
Google LaMDA 大语言模型发布新应用,一周内突破200万安装量,碾压ChatGPT 引发火爆热潮!

Google LaMDA 大语言模型发布新应用,一周内突破200万安装量,碾压ChatGPT 引发火爆热潮!”

  1.Character.AI 官网链接:https://beta.character.ai 2.ExpressVPN 优惠链接:https://bittly.cc/expressvpn
admin的头像-零度博客admin
1.3W+6539