在最近一次访谈中,World Labs联合创始人李飞飞和a16z普通合伙人Martin Casado探讨了“世界模型”的概念,强调了构建这一模型的迫切需求。他们讨论了当前AI的局限性,特别是大语言模型(LLMs)的不足,并指出人类智能的大部分超越了语言范畴。李飞飞认为,要实现全面的智能,需要集中化的...
标签 AI 下的文章
- 首页
- AI
本文详细介绍了如何使用Transformers框架进行大型语言模型(LLM)的训练,包括预训练、有监督微调和高效微调。预训练部分讲解了使用Transformers框架和分布式框架deepspeed进行模型预训练的全过程,包括模型初始化、数据预处理和使用Trainer进行训练。有监督微调部分则介绍了如...
本文详细介绍了大语言模型(LLM)的概念、特点、能力以及训练过程。LLM是参数量更多、在更大规模语料上进行预训练的语言模型,具有涌现能力、上下文学习能力、指令遵循能力和逐步推理能力。训练LLM需要经过预训练(Pretrain)、有监督微调(SFT)和人类反馈强化学习(RLHF)三个阶段。预训练使用海...
从零开始的大语言模型原理与实践教程深入理解 LLM 核心原理,动手实现你的第一个大模型项目介绍 很多小伙伴在看完 self-llm 开源大模型食用指南 后,感觉意犹未尽,想要深入了解大语言模型的原理和训练过程。于是我们决定推出《Happy-LLM》项目,旨在帮助大家深入理解大语言模型的原理和训练过程。 本项目是一个系统性的 LLM 学习教程,将从 NLP 的基本研究方法出发,根据 LLM...
本文提供了一个全面的AI产品经理学习路线图,包括九个步骤,涵盖从基本概念到AI评估系统的各个方面。每个步骤都提供了相应的资源和工具,如统计学、Python、神经网络、提示词工程、模型微调、RAG、AI代理与工作流、AI原型设计与构建、基础模型和AI评估系统。此外,还提供了一些额外的AI资源,如AI ...
Artificial Analysis发布的《2025年第二季度中国人工智能现状报告》显示,中国的人工智能实验室已接近美国水平,尤其是DeepSeek成为全球第二,背后有10多个企业组成的生态系统。报告指出,中国AI生态系统具有深度,多个实验室的模型在智能评分上令人印象深刻,且采用开放权重策略支持国...
王大勇(Samool)预测,根据人工智能的指数级增长,通用人工智能(AGI)将在2030年左右到来,最晚不超过2035年。他拥有丰富的电信行业和软件开发经验,包括在多家公司担任信息总监和开发多个系统。
微软、OpenAI、谷歌、Anthropic等公司在AI领域取得新进展,包括编程助手、AI硬件、新模型等。Nvidia、FutureHouse、Mistral等公司在机器人技术、治疗黄斑变性、开放编码AI等方面取得突破。新加坡Sharpa发布高自由度机器人手,特斯拉和字节跳动分别在视频学习转移和多模...
Gemini 2.5 Pro是一款免费的软件,可以替代专家进行视频转录、播客和病毒性帖子。文章提供了五个技巧来使用Gemini 2.5超越竞争对手,包括如何进入Google AI Studio,点击Gemini 2.5 Pro,添加视频,并提示转录视频并标记时间戳。
Hugging Face发布了免费的AI在线课程,涵盖大型语言模型、AI代理、深度强化学习、计算机视觉、音频处理、游戏机器学习、3D机器学习、扩散模型等领域,并提供开源AI食谱供学习者实践。教程可在官网学习。
玛雅文明是中美洲一个繁荣于公元前2000年至16世纪的文明,以其建筑、书写系统、数学和天文学成就而闻名。玛雅人在艺术、数学、天文学和复杂历法创造等领域取得了重大进步,建造了宏伟的建筑结构,如金字塔和寺庙。然而,玛雅文明在末期古典时期经历了显著的衰落,主要城邦被废弃,人口减少。衰落的原因包括环境恶化、...
本文从第一性原理出发,预测了2025-2035年人工智能的五大发展趋势:基础技术驱动力、算法演进与范式转变、系统层级创新、现实应用场景爆发以及安全性、治理与哲学挑战。预计到2030年,专用AI芯片将使单位算力成本降低10-50倍,开源模型训练门槛降低,多模态大模型将具备逻辑推理、跨领域迁移和计划能力...
太阳神鸟的故事讲述了昆仑山上的十只金乌,它们是太阳的化身,每天为大地带来光明和温暖。一只金乌因调皮落入人间,被后羿射杀,导致大地陷入黑暗。仙女指引后羿寻找另一只金乌,最终他射伤金乌的翅膀,使太阳重新升起。金乌坠落的地方出现了太阳神鸟,它张开翅膀,为大地带来光明和温暖。
AI新闻20250312报道了Ilya Sutskever的SSI公司正在采取新路线实现先进AI,并计划筹集20亿美元,估值300亿美元。同时,微软开发新AI模型MAI以减少对OpenAI的依赖,DeepMind研究员推出Reflection AI获得1.3亿美元融资,X用户可通过@grok启动Gr...
本文提供了10个Grok-3提示,旨在帮助个人提升思维、解决问题、预见未来、提高说服力、加速学习、增强自我意识、优化日常表现、解密宇宙奥秘、成为谈判专家和策划改变人生的愿景。这些提示包括心理训练程序、战略分析、趋势预测、修辞学、快速学习技巧、心理分析、个性化日程设计、宇宙哲学、谈判策略和人生规划。
傻猫软件有限公司自1999年成立以来,始终致力于用科技改变世界。在AI时代,公司将再次出发,成为领航者,以微信小程序为突破口,AI智能体为利器,重塑企业信息化场景。公司将专注于企业智能体研发、销售和运营,打造AI时代的“轻型武器”,赋能企业数字化转型。傻猫软件的战士们将共同谱写新的辉煌篇章。
成都傻猫软件提供企业级和个人智能体产品。企业级产品基于aipu.com平台,旨在提供定制化智能解决方案,提升企业效率和创新能力,目标客户包括电商、金融等行业,产品功能包括多模型接入、数据安全等,定价策略涵盖SaaS平台、私有化部署和API接口。个人智能体产品基于ip66.com平台,提供个性化智能助...
本文介绍了在Docker中安装和配置Ollama的方法。首先,用户可以通过Docker软件的可视化界面搜索并下载Ollama镜像,或者使用命令行拉取下载镜像。接着,用户可以在Docker界面中运行Ollama镜像,或者通过命令行启动。文章还提供了Ollama的常用指令,如启动、创建、显示模型信息、运...
本文介绍了在Linux系统中安装和配置Ollama的方法,包括快速安装、手动安装、更新、安装特定版本、查看日志和卸载。快速安装可以通过一条命令行完成,手动安装需要下载二进制文件并添加为自启动服务。更新可以通过重新运行安装命令或下载新的二进制文件来实现。安装特定版本需要设置环境变量OLLAMA_VER...