StableVicuna

第一个通过RLHF训练的大规模开源聊天机器人

标签：AI训练模式

链接直达手机查看

StableVicuna是由 Stable Dffusion背后的StabilityAl推出的第一个通过基于人类反馈的强化学习(RLHF)训练的大规模开源聊天机器人。StableVicuna是Vicuna v0 13b的进一步指令微调和RLHF训练版本，它是一个指令微调的LLaMA 130亿模型。

数据统计

相关导航

智源“悟道”大模型，中国首个+世界最大人工智能大模型

低门槛快速定制大语言模型的引擎

魔搭社区

阿里达摩院推出的AI模型社区，超过300+开源AI模型

OpenAI旗下AI代码生成训练模型

简单免费的机器学习模型训练工具

Google AI文字到图像生成模型

暂无评论

暂无评论...