收藏本版 |訂閲

机器学习/自然语言处理 今日: 0|主題: 239|排名: 17 

  • 读心与芯:我们与机器人的无限未来02梦想(下)
    1. 时间的节约 1.1. 机器人的传感器可以感知环境,识别正在发生的事情,要实现完全自动驾驶,其精确度必须更高 1.1.1. 汽车的控制系统必须足够快,才能对传感器和大脑的感知做出正确反应 1.1.2. 汽车还要能在意外天气和路况下安全行驶,这又是一系列挑战 1.1.3. 汽车机器人还有可改进的地 ...
    070 不聊的 发表于 2025-7-23 机器学习/自然语言处理
  • 读心与芯:我们与机器人的无限未来01梦想(上)
    1. 机器人如何创“芯”​? 1.1. 希望机器人有人类之“心”​,便于人机交往,实现人机共鸣 1.2. 要求机器人必须遵守诸如阿西莫夫“机器人三定律”之类的底线规则 1.3. 机器人必须创“芯”​,心芯合一,才能真正增进人类的福祉,共同构建未来世界的智能社会 2. 概述 2.1. 机器人不会抢走我 ...
  • 预测概率的先验校准
    目录为什么需要校准?应用贝叶斯定理建立两个世界的联系推导校准公式直观理解将先验校准融入偏置代码实践(1) 准备工作(2) 生成模拟数据集(3) 负样本欠采样(4) 模型定义与训练(5) 评估校准前的模型(6) 实施先验校准(7) 评估校准后的模型(8) 可视化对比 在知乎上也发了一份:https://zhuanlan.zhihu.com/p/192607827269487859 ...
    023 宁秋水 发表于 2025-7-13 机器学习/自然语言处理
  • Pytorch基础问题RuntimeError: Expected all tensors to be on the same device
    Pytorch基础问题RuntimeError: Expected all tensors to be on the same device Introduction 今天让 Claude 4 Sonnet 给我写Nogo的reinforcement learning的训练代码,结果就直接报错: RuntimeError: Expected all tensors to be on the same device 我平时不怎么注意细节,为了养成不依赖LLM的好习惯,以后对报错写博 ...
  • 【深度学习数学基础:线性代数】1. 矩阵
    (这系列文章所有的内容是深度学习用的数学知识,都在实数域上讨论问题,且从数学专业的人的角度来看) 这是我听课的笔记,也有一些自己补充的内容(课程地址:https://www.bilibili.com/cheese/play/ss32496) 1. 矩阵 1.1 矩阵的定义 由\(m\times n\)个数\(a_{i j(i=1,2, \cdots, m ; j=1,2, \cdots, n)}\)排成\(m\)行、\ ...
  • 规则学习:让机器学习像人类一样思考的可解释之路
    在机器学习领域,规则学习是一颗独特的明珠--它不像深度学习那样神秘,而是用人类可读的"如果-那么"规则来做出决策。 想象一下医生通过一系列症状判断疾病,或者风控系统根据用户行为拒绝贷款,规则学习的魅力正在于这种透明可解释性。 1. 基本概念 规则学习的目标是从数据中提取出一系列的规则,这些规则能够帮助我们对新 ...
    0102 啊喇靁 发表于 2025-6-11 机器学习/自然语言处理
  • 西安交大超算中心服务器配置注意事项
    1.账号申请成功后linux系统默认用户密码为:hpc@手机号 2.使用anaconda镜像源的时候不能参考《Anaconda_PyPI镜像使用帮助》教程,要参考下面链接:https://hpcdocs.xjtu.edu.cn/software/python/ 3.同时再把镜像源换成清华镜像,西安交大镜像源不可用。 4.安装pytorch时也不能参考《pytorch配置与提交计算任务说明》教程, ...
  • 概率图模型:机器学习的结构化概率之道
    当复杂世界的不确定性遇上图的结构化表达,概率图模型应运而生。 它可以帮助我们理解和建模变量之间的复杂关系。 想象一下,你正在尝试预测明天的天气,你需要考虑温度、湿度、气压等多种因素,这些因素之间存在着复杂的相互作用。 概率图模型就像是一张“关系网”,能够清晰地表示这些因素之间的依赖关系,并帮助我们进行 ...
  • 当机器学习遇见压缩感知:用少量数据重建完整世界
    在数据处理的世界里,我们常常会遇到这样的问题:数据量太大,存储和传输成本高昂,但又不能丢失重要信息。 这时候,压缩感知(Compressive Sensing,CS)就像一位神奇的“数据魔法师”,能够帮助我们高效地处理数据。 本文我们就来深入了解一下压缩感知是什么,它的原理和作用,以及如何用代码实现它。 1. 压缩感知是什么 ...
  • 稀疏表示与字典学习:让数据“瘦身”的魔法
    在机器学习的世界里,我们常常会遇到各种复杂的数据,它们可能包含大量的特征,但其中真正有用的信息却很少。 这就像是在一个杂乱无章的房间里,我们只需要找到那些真正重要的物品,而忽略掉那些无关紧要的杂物。 稀疏表示和字典学习就像是整理房间的工具,帮助我们找到那些关键的信息,让数据变得更加简洁和有用。 1. 稀疏 ...
    075 文阁 发表于 2025-6-6 机器学习/自然语言处理
  • 机器学习中的"食材挑选术":特征选择方法
    想象你要做一道美食,面对琳琅满目的食材,优秀的厨师不会把所有原料都扔进锅里,而是会选择最适合的几种。 在机器学习中,特征选择就是这个挑选过程,从原始数据中选择对预测目标最有用的特征(列),就像挑选优质食材一样重要。 1. 什么是特征选择? 特征选择是机器学习中一个至关重要的步骤,它从原始数据的众多特征中挑 ...
    086 香人 发表于 2025-6-3 机器学习/自然语言处理
  • 度量学习:让机器学会“距离”的奥秘
    度量学习是一种神奇的机器学习技术,它的核心目标就是教会机器如何更好地衡量不同数据点之间的 “距离” 。 在我们日常生活中,距离这个概念很直观,比如两点之间的直线距离。 但在机器学习的世界里,数据通常是高维的,比如一张图片可以被表示为一个包含像素值的高维向量。 那么,如何衡量这些高维数据之间的相似性或差异 ...
    053 永朝 发表于 2025-5-28 机器学习/自然语言处理
  • 降维技术:带你走进数据的“瘦身”世界
    在机器学习和数据分析中,数据的维度常常是一个让人头疼的问题。 想象一下,你面前有一张包含成千上万列特征的表格,每一列都可能是一个重要的信息源,但同时也会让计算变得异常复杂。 这时候,降维技术就派上用场了!它可以帮助我们把高维数据“瘦身”成低维数据,同时尽可能保留有用的信息。 今天,介绍几种常见的降维方 ...
    080 未未 发表于 2025-5-27 机器学习/自然语言处理
  • 不同数据场景下的聚类算法
    在数据分析和机器学习领域,聚类是一种非常重要的无监督学习方法,它可以帮助我们发现数据中的内在结构,将相似的数据点分组到一起。 本文将介绍几种常见的聚类算法,包括原型聚类(如 k-均值、学习向量量化、高斯混合聚类)、密度聚类(DBSCAN)和层次聚类(AGNES)。 通过浅显易懂的方式介绍它们的原理,探讨它们的适用场 ...
  • 机器学习 概率统计基础 随机变量部分
    第零章 积分 变上限积分:设积分形式为\(\boxed{I(x)=\int_{v(x)}^{u(x)}f(t,x)\text{d}t}\),则对\(I(x)\)求导得: \[\boxed{\frac{\text{d}I}{\text{d}x} = f(v(x), x) \cdot v'(x) - f(u(x), x) \cdot u'(x) + \int_{u(x)}^{v(x)} \frac{\partial f}{\partial x}(t, x) \text{d}t} \] 二重积分:\(\boxed{\iint_Df(x, ...
    035 辞别 发表于 2025-5-26 机器学习/自然语言处理
  • Linux下安装mamba-ssm踩过的坑
    起初的原因是,想要跑一个用到了mamba-ssm的项目,故尝试在wsl中配置mamba-ssm库。提示需要pip install mamba-ssm后报错频繁,遇到了许多问题。查阅了很多blog和issue,安装了很多次环境,仿佛已经对注意事项倒背如流,但是就是无法解决最后的selective_scan_cuda.cpython-310-x86_64-linux-gnu.so: undefined symbol: ZN3c ...
  • 聚类是如何度量数据间的“远近”的?
    在聚类分析中,距离度量是核心概念之一,它决定了数据点之间的相似性或差异性,从而影响聚类结果的质量。 选择合适的距离度量方法,就像为数据选择合适的“观察视角”,能够帮助我们发现隐藏的模式结构。 本文将详细介绍几种常用的聚类距离度量方法,包括它们的原理、代码实现,以及这些方法满足的基本性质。 1. 常用距离度 ...
  • 你的聚类模型靠谱吗?5大外部指标彻底揭秘
    在聚类分析中,我们常常需要评估聚类结果的质量。 外部指标是一种通过与已知的“真实标签”进行比较来评估聚类性能的方法。 这些指标可以帮助我们判断聚类算法是否能够准确地将数据划分为有意义的类别。 本文将介绍几种常见的外部指标,包括 Jaccard 系数、FM 指数、Rand 指数、DB 指数和 Dunn 指数,并通过代码示例展示如 ...
  • 同样的数据,更强的效果:如何让模型学会‘互补思维’?
    集成学习虽然能够通过组合多个学习器来提高预测性能,然而,如果这些学习器过于相似,集成的效果可能并不理想。 因此,增强学习器的多样性是提升集成学习性能的关键。 多样性带来的优势在于: 群体智慧原理:多样化的模型可以从不同角度捕捉数据规律 误差互补效应:不同模型的错误模式不同,投票后误差相互抵消 防止过拟合 ...
    027 漫昵 发表于 2025-5-16 机器学习/自然语言处理
  • 集成学习中的多样性密码:量化学习器的多样性
    在集成学习中,多样性是一个关键概念,简单来说,多样性衡量的是各个学习器之间的差异程度。 如果学习器之间差异很大,那么它们的组合就更有可能覆盖更多的情况,从而提高集成模型的性能, 就像足球队需要不同位置的球员配合一样。 下面介绍四种常用的多样性度量方法及其实现。 1. 不合度量(Disagreement Measure) 不合度 ...
    011 欧联穆 发表于 2025-5-14 机器学习/自然语言处理
  • 下一頁 »

    快速發帖

    還可輸入 180 個字符
    您需要登錄後才可以發帖 登錄 | 立即注册

    本版積分規則

    相关侵权、举报、投诉及建议等,请发 E-mail:qiongdian@foxmail.com

    Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.

    在本版发帖返回顶部