type
status
date
slug
summary
tags
category
icon
password
😀
这里写文章的前言: 一个简单的开头,简述这篇文章讨论的问题、目标、人物、背景是什么?并简述你给出的答案。
可以说说你的故事:阻碍、努力、结果成果,意外与转折。
 

📝 主旨内容

向量数据库

向量数据库是专门设计来存储和处理向量数据的数据库。在这里,"向量"通常指的是在高维空间中表示数据点的数字数组。向量数据库广泛应用于机器学习、深度学习、推荐系统和相似性搜索任务中,尤其是在处理图像、视频、音频和文本数据时。它们优化了向量之间的相似性搜索,能够快速找到与给定向量最相似的向量集合。
向量数据库的关键优势在于其高效的索引和检索能力,能够处理复杂的查询,如余弦相似度或欧氏距离,这对于传统数据库来说是挑战性的。这些数据库通常使用特定的算法和数据结构(如KD树、倒排索引等)来优化高维空间中的搜索操作。

文档数据库

文档数据库是一种非关系型数据库,专门设计来存储、检索和管理文档格式数据。文档在这种数据库中通常以JSON、BSON或XML格式存储,这使得它们非常适合存储结构化或半结构化数据。文档数据库允许数据以其自然格式存储和查询,无需预先定义数据模式。
文档数据库的一个关键特点是它们的灵活性。由于无需固定的表结构,开发者可以轻松添加或删除记录中的字段,这使得文档数据库非常适合敏捷开发和快速迭代的项目。文档数据库支持丰富的查询语言,使得开发者可以方便地执行复杂查询。

应用场景对比

  • 向量数据库:非常适合那些需要执行复杂数据分析、机器学习模型或相似项搜索的应用。例如,在一个推荐系统中,可以使用向量数据库来存储用户和物品的特征向量,并快速检索出与特定用户兴趣相匹配的物品。
  • 文档数据库:非常适合需要存储大量文档格式数据的应用,如内容管理系统、电子商务平台和移动应用。文档数据库的灵活性使其特别适用于数据模式频繁变化的情况。

🤗 总结归纳

介绍两种数据库,因为随着SOE技术增强和团队知识库越发重要,迫切需要数据库工具来帮助团队知识积累或者个人知识积累,像最近很多的kimichat,支持200w文本,长文本给向量知识库的实现提供了更多可能。
 
 
💡
有关这篇博客的任何问题,欢迎您在底部评论区留言,我会在github邮箱中第一时间收到邮件,让我们一起交流~
batch and patch深度学习模型训练基本参数
  • Giscus
Zachary_Yang
Zachary_Yang
一个普通的干饭人🍚
Announcement
🎉欢迎来到我的博客🎉
-- 亲爱的读者们,你们好! ---
👏在这里,我希望能够和你们一起分享我对生活的观察、对技术的理解和热爱,暂将博客分为以下几个栏目👏
🌿 心绪漫卷边:一些小随笔
🌌 智绘非遇路:AI领域
😊 浅笑编程边:前后端开发
🛠 技术汇流石下:零散技术分享

祝好,
Zachary_Yang