简介

在物联网与人工智能融合的时代,搭载 ESP32-S3 的行空板 K10开发板以其高集成度脱颖而出:配备 2.8 英寸 LCD 显示屏、双核处理器、麦克风、扬声器以及 Wi-Fi/蓝牙连接。它专为教育和原型开发而设计,为 AI 驱动的语音/图像应用提供了一个“开箱即用”的平台。

GitHub 上的开源项目xiaozhi-esp32开启了新的可能。它充分利用 ESP32-S3 的功能,并集成 DeepSeek 等模型的 API,实现了本地化的 AI 语音聊天。我们提供了免编译的固件,您只需要简单的烧录上传即可让行空板 K10 摇身一变,成为一款响应式智能终端,支持多轮对话、唤醒词检测和实时翻译。

硬件与开源创新的协同作用降低了人工智能开发的门槛。借助直观的界面和高效的边缘计算,开发者可以轻松构建语音助手、教育工具解决方案的原型。边缘人工智能的未来由此开启。

xiaozhi-esp32 是一个开源的 ESPIDF 项目,由于 ESPIDF 的配置过程比较繁琐,我们整理了一些 xiaozhi 固件供大家直接烧写。

软件下载

烧录工具

flash_download_tool

固件下载

固件版本 功能介绍
xiaozhi-1.6.6b-unihikerk10-CNver 1.6.6版本中文界面,微信聊天框
- 支持视觉识别功能,可以通过“帮我拍张照片”,“你看到了什么”等语音命令开启。
- 无法在屏幕观察到摄像头拍摄画面
xiaozhi-1.6.6-unihikerk10-CNver 1.6.6版本中文界面,非微信聊天框
- 支持视觉识别功能,可以通过“帮我拍张照片”,“你看到了什么”等语音命令开启。
- 可在屏幕观察到摄像头拍摄画面
xiaozhi-1.6.2-unihikerk10-CNver 1.6.2版本中文界面,微信聊天框样式
-更新WiFi组件版本,并从OTA接口读取WebSocket服务器

烧录教程

步骤1 将小智刷入行空板K10

长按K10背面的boot键,然后通过USB将其连接电脑
并打开“Flash download tool”选择
ChipType:ESP32-S3
WorkMode:Develop
LoadMode:UART

在第一行空白框中按“…”按钮,选择上面下载的固件并且解压缩得到.bin文件,并且勾选上此bin文件的箭头,导入.bin文件如下图:

需要用 0x00 填充起始地址。
然后我们需要选择正确的COM端口并将波特率设置为1152000。
然后按“ERASE”键擦除K10中当前的固件。
擦除步骤完成后,按“START”将小智固件刷入K10。

步骤2 配置 Wi-Fi 和语言模型

成功刷新固件后,按下K10背面的RST按钮。
K10首先会进入Wi-Fi配置模式

现在用你的电脑或手机连接小智的热点,然后配置 Wi-Fi SSID 和密码,让小智连接到互联网。
注:K10 只能连接 2.4GHz Wi-Fi

一旦 Wi-Fi 连接成功,K10 将在 3 秒内重启。
并且K10的屏幕上将显示一个六位数的设备代码。

下一步可以去小智配置站点配置语言模型和说话人。
使用浏览器输入xiaozhi.me打开小智配置网站,并且点击控制台

使用您的手机号码注册一个小智账号。

进入控制台后,再K10显示屏上添加设备并输入设备代码

目前,xiaozhi已成功部署在UNIHIKER K10上。
您可以进入配置角色屏幕来更改 xiaozhi 的角色。

步骤3 唤醒你的AI伙伴

现在你可以使用"你好,小智"唤醒K10并与其交谈
K10板载两个按键功能如下:
A:短按-中断/唤醒,长按1s-音量加。
B:短按-中断/唤醒,长按1s-音量减

在1.6.6版本以上,支持调用摄像头识别画面。

注意事项

  • 烧录小智代码后暂时无法调用板载的光线,温湿度等传感器
  • 烧录小智后,如想恢复出厂设置,可查看此教程

鸣谢

小智AI属于一个开源项目。行空板K10的适配以及功能的完善都是由社区爱好者推动,感谢你们所作的贡献。

Github项目地址:
https://github.com/78/xiaozhi-esp32

项目原作者:
@78(虾哥)

项目贡献者:
@HonestQiao
@Paul Xu
@SunnyBoy-y
@YeezB

注:如果您的K10相关代码被成功合并到小智主线,您可以通过邮件联系我们,我们会将您的GitHub ID加入贡献者名单。
Email: unihiker@dfrobot.com