基于 OceanBase 官方文档提供的《RAG 智能机器人Demo 搭建》流程,大家可以比较轻松的搭建一个聊天机器人。很多朋友也会问到,是否能基于这个 Demo 扩展更多的用途呢?

本文便是一个基于 Demo 改造自己的专属机器人的实践分享。

一般市面上的 AI 聊天或搜索机器人都较大,搜索范围宽泛,有时难以精确给到我们所需的答案。而自己搭建的机器人就可以精准地将搜索范围限定在特定区域内。

下面是一个搭建自己专属学习机器人的实践:
最近在结合视频和其他资料学习cmake的相关知识,资料在github上找到的markdown版本CMake-Cookbook,接下来将所有的markdown写入数据库中,并利用聊天机器人来快速查找和关联相关知识,减少了在书中翻找和整理信息的时间。

1. 下载资料

# cd doc_repos
# git clone https://github.com/xiaoweiChen/CMake-Cookbook.git
# cd ..

2. 转换标题

# poetry run python convert_headings.py doc_repos/CMake-Cookbook

3. 生成向量数据并插入数据库

# poetry run python embed_docs.py --doc_base doc_repos/CMake-Cookbook
// 可以加一些参数设置一些配置,详情请看embed_docs.py文件内容

4. 启动web界面

# poetry run streamlit run --server.runOnSave false chat_ui.py
		
    You can now view your Streamlit app in your browser.
		
	Local URL: http://localhost:8501
	Network URL: http://172.xxx.xxx.xxx:8501
	External URL: http://xxx.xxx.xxx.xxx:8501 # 这是您可以从浏览器访问的 URL

5. 效果

我学习到Doxygen,想在书中检索这部分内容,让机器人先总结,效果见下面两张图,最后给出了文档来源,如果不够详细可以根据文档来源找到markdown部分进行查看.

1732506891

1732506911

6. 总结

如果自己的知识库是markdown格式,又不想把内容公开到互联网,那么在内网中使用向量数据库打造属于自己的问答机器人用于检索数据和回答问题,这样既提高了效率,又节约了时间,可谓是一举两得。

What's more

  • OceanBase 云数据库 现在已经支持365天免费试用,开通事务性共享实例(MySQL模式),即可免费搭建自己的智能机器人。免费开通 OceanBase 云数据库 >>
     
  • 11 月 28日晚 7点,OceanBase 视频号将为你带来 《AI 动手实战营 :基于 OceanBase + LLM 打造属于你的智能助手》,欢迎大家扫码预约

Logo

了解最新的技术洞察和前沿趋势,参与 OceanBase 定期举办的线下活动,与行业开发者互动交流

更多推荐