基于Chroma搭建个人知识库的全文索引
Chroma是一个可以帮助计算机理解文本的工具。它可以让你把文本放到一个“盒子”里,这个“盒子”可以让计算机更容易地找到和理解文本。你可以用它来创建一个文本库,然后通过输入问题,找到和问题相关的文本。比如,你可以创建一个文本库,里面有许多关于历史的文章,然后你可以输入“什么是古代中国的四大发明”,Chroma就可以帮你找到相关的文章。Chroma还有很多其他的功能,可以让你更方便地管理和搜索文本。它是完全免费和开放的,任何人都可以使用它。
构建Docker镜像
1 |
|
- mkdir -p ~/app/chroma && cd ~/app/chroma && nano Dockerfile && nano docker-compose.yml
- git clone –depth=1 https://ghproxy.com/https://github.com/chroma-core/chroma.git
- sudo docker build -t limour/chroma .
- cp ./chroma/bin/docker_entrypoint.sh ./docker_entrypoint.sh
- nano ./docker_entrypoint.sh 添加上pip镜像 -i https://pypi.tuna.tsinghua.edu.cn/simple
部署Docker镜像
1 |
|
- nano docker-compose.yml
- sudo docker-compose up -d
- sudo docker-compose logs
安装客户端
- conda create -n chroma -c conda-forge python=3.10 -y
- conda activate chroma
- pip install chromadb -i https://pypi.tuna.tsinghua.edu.cn/simple
- conda install -c conda-forge ipykernel -y
- python -m ipykernel install –user –name python-chroma
- 更简单的:# conda create -n chroma -c conda-forge chromadb -y
测试用例
1 |
|
- sudo docker-compose restart 测试持久化
基于Chroma搭建个人知识库的全文索引
https://occdn.limour.top/2714.html