llama2
Meta开源了他们的大模型。由于它支持免费商用,很有可能成为GPT界的安卓。之前使用llama.cpp安装使用过,这次听说有了类似于stalbe diffusion webui的工具,也就是text generator webui,于是便通过这个方法来使用llama2。记录这次安装的过程。
安装 text generator webui
项目托管在github上,有详细的安装说明。我的安装过程如下:
-
下载Mac专用的安装包
-
在Terminal中执行
start_macos.sh
时,会提示权限不够(permission denied)。解决方法
chmod +x start_macos.sh
-
安装程序会安装全部所需的文件,需要梯子以免部分软件无法下载导致安装失败。中途会提示选择合适的GPU。
下载llama2
下载llama2还是有点麻烦的,我先是用了境外的邮箱申请,总算通过了。
简要步骤:
如果不想等待的话,可以使用Tom Jobbins的提供的模型中下载。
下载方法
使用text generator webui下载Hugging Face上的模型非常简单。
-
找到 TheBloke/CodeUp-Llama-2-13B-Chat-HF-GGML,并点击复制按钮
-
在Model -> Download custom model or LoRA 中粘贴对应的模型ID
经过较长时间的等待,即可自动完成下载。
体验
Meta自己公布的模型效果如下:
![模型对比](/assets/blog-images/20230811/benchmark.jpg)
目前体验了一下,比llama好了一些,当问及大模型中文问题时,它就开始有点像乱码了。英文自身的回答,体感还可以。目前有了llama-2-7b模型有了中文版,但是效果也一般般。
API也支持了
# For local streaming, the websockets are hosted without ssl - http://
HOST = 'localhost:5000'
URI = f'http://{HOST}/api/v1/generate'
期待大模型的进一步演化,想象空间真是无限的。