AI日报

blog-thum
以自组织映射算法促进高效的LLM检索增强生成

本文将探讨使用自组织映射(SOM)算法来提升RAG的LLM上下文的检索性能,并给出具体的示例展示。当今社会,人们使用大量数据训练包含数百万和数十亿模型参数的大型语言模型(LLM),目标是生成文本,如文本完成、文本摘要、语言翻译和回答问题。

read more
blog-thum
基于区块链的数据泄漏检测系统

在企业的日常运营中,数据泄漏在广义上是指未经授权或已被授权的人员,错误或恶意地访问、删除、修改或传输企业或个人数据,而引发的各种安全事件。除了系统自身软硬件错误、以及源自外部的攻击,由组织内部人员造成的数据泄漏,在频次和财务影响等方面都呈上升趋势。

read more
blog-thum
2024年在Web应用程序中实现前沿技术的JavaScript库

在当今的信息技术领域,ChatGPT这款人工智能工具已经广为人知,它是机器学习技术在实践中的一个典型应用。尽管人工智能技术具有创新性,并伴随一定的潜在风险,但开发人员已经开始在日常工作中广泛使用这类AI工具。

read more
blog-thum
五个简单好用的本地运行大模型的方法

PrivateGPT的特点是脚本可以摄取数据文件,将其分割成块,创建“embeddings”(文本含义的数字表示),并将这些嵌入存储在本地Chroma矢量存储中。当你提出问题时,该应用程序会搜索相关文档,并将其发送给LLM以生成答案。

read more
blog-thum
这款Linux发行版发起AI禁令!生成代码质量堪忧!阿里也被大模型幻觉愚弄了!网友:人比生产力更重要!

Gentoo理事会成员MichałGórny最初于2月27日提出了对人工智能代码的禁令,Gentoo是一个管理Linux发行版的民选委员会。Górny主张禁止人工智能有三个主要原因:潜在的版权侵权、质量控制问题、对人工智能高功耗的道德考虑以及大公司在技术塑造中的作用。

read more