不止于搜索!Perplexity Labs深度解析:以项目为核心的 AI 工作流!
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
Perpl ...
华为MAAS、阿里云PAI、亚马逊AWS SageMaker、微软Azure ML各大模型深度分析对比
一、技术架构深度对比
1. 硬件基础设施
平台
自研芯片
分布式训练方案
边缘协同能力
华为MAAS
昇腾Ascend 910 + Atlas 900集群
MindSpore + HCCL(华为集合通信库)
鸿蒙OS边缘节点 + ModelBox
阿里云PAI
含光800(NPU) + 神龙服务器
PAI-TF(优化版TensorFlow)+ ACK Pro集群
边缘容器服 ...
将你的Dify应用转为MCP服务器
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
上文 ...
你的 Chrome 再次进化!12个新功能让浏览器更快、更安全、更智能
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
1 在手机上分 ...
ES实战从零搭建高性能商品搜索系统
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
搜索这个特性 ...
Spring 5 响应式编程:构建高性能全栈应用的关键
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
1 引言
Sprin ...
Spring 5 响应式编程:构建高性能全栈应用的关键
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
1 引言
Sprin ...
如何实现RAG与MCP集成
1.概述
在人工智能的创新浪潮中,检索增强生成(RAG)技术以其高效调用外部知识、提升生成内容准确性的能力备受瞩目,而模型上下文协议(MCP)则为不同模型间的交互与协同提供了标准框架。当 RAG 的知识检索优势与 MCP 的灵活交互能力相遇,不仅能大幅提升 AI 系统的实用性与智能水平,还能为复杂场景下的应用开发开辟新路 ...
如何实现本地大模型与MCP集成
1.概述
本文将围绕构建兼具本地运行大型语言模型(LLM)与MCP 集成能力的 AI 驱动工具展开,为读者提供从原理到实践的全流程指南。通过深度整合本地大模型的隐私性、可控性优势与 MCP 工具的自动化执行能力,帮助用户以低门槛、高效率的方式,打造个性化 AI 助手,实现任务自动化 —— 无论是文档处理、数据分析,还是流程 ...
为什么人类程序员仍然比大语言模型(LLMs)强大?
为什么人类程序员仍然比大语言模型(LLMs)强大?
作者:antirez
这是一个简短的小故事,告诉你为什么人类的编程能力仍然远远领先于当前的AI技术。请注意,我并不是反AI的人,熟悉我的朋友都知道这一点。我日常都会使用大语言模型(LLMs),包括今天也是如此。当我需要快速验证自己的想法、进行代码审查、了解是否有更好的 ...
SmolVLM2轻量级视频多模态模型,应用效果测评(风景、事故、仿真、统计、文字、识物)
SmolVLM2轻量级视频多模态模型,应用效果测评
目 录
1. 前言... 2
2. 应用部署... 2
3. 应用效果... 4
1.1 风景图像理解... 4
1.2   ...
RAG越来越不准?从Dify和ima知识库看元数据与标签如何让大模型更懂你
你是否有这样的经历:”知识库文档越来越多,知识库问答却越来越不靠谱,RAG检索到的都是一堆不相关的内容。“
在这个信息爆炸的时代,我们不缺资料,缺的是找到"对的资料"的能力。
元数据和标签看似普通,却能很大提升RAG能力。
这篇文章聊一聊它们如何辅助RAG系统真正理解用户意图,精准找到需要的信息。
元数据(Metadat ...
重磅开源 基于AI大语言模型的AI 助手全套开源解决方案 AI开源平台geekai-django
介绍
GeekAI 基于AI大语言模型的AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 OpenAI, Claude, 通义千问,Kimi,DeepSeek等多个平台的大语言模型。
基于极客学长大佬的开源项目geekai 二次开发而来。首先感谢大佬的开源,致敬。大佬的项目地址:https://gitee.com/blackfox/geekai
我就是把前台页 ...
Dify解锁并行处理,四种模式助你玩转复杂工作流!
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
Dify ...
不止是推理王者!DeepSeek R1 如何用“低成本、高性能”重塑 AI 产业格局?
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
1 推 ...
微软开源bitnet b1.58大模型,应用效果测评(问答、知识、数学、逻辑、分析)
微软开源bitnet b1.58大模型,应用效果测评(问答、知识、数学、逻辑、分析)
目 录
1. 前言... 2
2. 应用部署... 2
3. 应用效果... 3
1.1 问答方面.. ...
ESP32大模型AI语音助手-软件到硬件
去年底开始基于ESP32开发DIY的各种AI语音智能助手层出不穷,AI智能玩偶也比较火热。目前市面上也都有比较成熟的开发板集成了各种模块麦克风、OLED、功放、摄像头等几乎是开箱即用,普通开发者买了折腾一通总能搞点什么出来,当然对于批量推出市场的使用这种开发板成本比较高,通常比较 ...
Claude 4 震撼发布:编程能力登顶,智能体迈入新时代!
本文已收录在Github,关注我,紧跟本系列专栏文章,咱们下篇再续!
🚀 魔都架构师 | 全网30W技术追随者
🔧 大厂分布式系统/数据中台实战专家
🏆 主导交易系统百万级流量调优 & 车联网平台架构
🧠 AIGC应用开发先行者 | 区块链落地实践者
🌍 以技术驱动创新,我们的征途是改变世界!
👉 实战干货:编程严选网
0 前言
Claud ...
【202406】预训练器的数据指南:衡量数据年龄、领域覆盖、质量和毒性的影响
值得注意的内容:
数据年龄问题,表面上越新越好,训练数据比评估数据旧就会导致性能下降。
但是,评估的内容是具有时间标签的,理所应当当然需要更新的模型来理解。
时间退化概念,本文之前就有人提出,2022年。
领域覆盖:多样性很重要。
质量和毒性的影响:质量和毒性是两个维度,质量过滤很必要,毒性过滤不 ...
SgLang代码细读-3.Cache
本地显存池
数据结构
因为kv cache有MHA,MLA,DoubleSparse 等多种自定义类型,需要进行一步抽象将框架和cache类型做隔离, 所以有了2级内存池的设计. 一级保存和cache类型无关的数据(token位置),跟具体业务隔离,二级给出抽象类接口, 不同的cache类型按需继承实现interface, 就能通过配置来进行管理.
二级显存池
req_to_t ...