标签大模型下的文章

AI Agents开源工具栈全解析~

本文详细介绍了9大类型、50个实用的AI Agent开源工具，包括计算机与浏览器操作、框架、语音、文档理解、记忆、测试与评估、监控与可观测性、仿真环境和垂直领域Agent。这些工具可以帮助开发者构建和优化AI智能体，提高开发效率。

2025 年 06 月 09 日

截至2025年6月最新的AI资讯重点内容汇总

2025年6月AI资讯汇总显示，AI技术在多个领域取得突破，包括谷歌Gemini 2.5 Pro模型、Anthropic的Claude 4系列模型、DeepSeek-R1-0528版本、腾讯混元图像2.0、中国石油昆仑大模型等。新产品与应用方面，PixVerse、快手、Opera、京东工业、Mini...

samool

2025 年 06 月 09 日

暂无评论

太空AI数据中心，要来了

随着AI技术的发展，地球上的数据中心电力需求激增，能源瓶颈难以解决。因此，越来越多的公司和投资者开始考虑在太空中建立数据中心，利用太阳能满足能源需求。美国初创公司Starcloud计划今年8月发射搭载英伟达H100芯片的卫星，这将是第一颗轨道数据中心。尽管面临技术与经济挑战，但轨道数据中心的初期应用...

samool

2025 年 06 月 08 日

暂无评论

Happy-LLM 《从零开始的大语言模型原理与实践教程》之第七章：大模型应用

本文是《从零开始的大语言模型原理与实践教程》第七章，介绍了大模型的应用。首先，讨论了大模型评测的重要性，包括评测数据集和主流评测榜单。然后，介绍了检索增强生成（RAG）技术，包括其基本原理和搭建RAG框架的步骤。最后，讨论了LLM Agent的概念、类型，并提供了一个简单的任务导向型Agent的实现...

samool

2025 年 06 月 07 日

暂无评论

Happy-LLM 《从零开始的大语言模型原理与实践教程》之第六章大模型训练流程实践

本文详细介绍了如何使用Transformers框架进行大型语言模型（LLM）的训练，包括预训练、有监督微调和高效微调。预训练部分讲解了使用Transformers框架和分布式框架deepspeed进行模型预训练的全过程，包括模型初始化、数据预处理和使用Trainer进行训练。有监督微调部分则介绍了如...

samool

2025 年 06 月 07 日

暂无评论

Happy-LLM 《从零开始的大语言模型原理与实践教程》之第五章动手搭建大模型

本文是《从零开始的大语言模型原理与实践教程》的第五章，介绍了如何动手搭建大模型LLaMA2。首先，定义了模型的超参数，包括模型大小、层数、头数等，并创建了ModelConfig类。接着，详细讲解了如何构建RMSNorm、LLaMA2 Attention和MLP模块，以及如何将这些模块组合成一个完整的...

samool

2025 年 06 月 07 日

暂无评论

Happy-LLM 《从零开始的大语言模型原理与实践教程》之第四章大语言模型

本文详细介绍了大语言模型（LLM）的概念、特点、能力以及训练过程。LLM是参数量更多、在更大规模语料上进行预训练的语言模型，具有涌现能力、上下文学习能力、指令遵循能力和逐步推理能力。训练LLM需要经过预训练（Pretrain）、有监督微调（SFT）和人类反馈强化学习（RLHF）三个阶段。预训练使用海...

samool

2025 年 06 月 07 日

暂无评论

Ollama 介绍

Ollama是一个开源工具，旨在帮助用户在本地轻松运行大型语言模型。它具有开源免费、简单易用、支持多平台、模型丰富、功能齐全、支持工具调用、资源占用低、隐私保护和社区活跃等特点。Ollama支持多种模型，如llama3.1、gemma2、qwen2等，并且提供了丰富的命令行工具，如serve、cre...

samool

2025 年 02 月 05 日

暂无评论

DeepSeek-R1个人和企业本地快速部署手册（可商用）

DeepSeek-R1是一款适合个人和企业部署的AI大模型，提供了不同参数的子模型以满足不同需求。个人部署可以通过Ollama框架在本地机器上轻松运行，而企业部署则可以根据自身业务需求选择合适的模型。本文详细介绍了个人和企业部署DeepSeek-R1的方法和步骤，包括模型选择、框架安装、模型下载和运...

samool

2025 年 02 月 04 日

暂无评论

DeepSeek 实用集成

DeepSeek实用集成是一个项目，旨在帮助用户轻松地将DeepSeek大模型能力接入各类软件。项目提供了多种应用程序、AI Agent框架、RAG框架、即时通讯插件、浏览器插件、VS Code插件、neovim插件、JetBrains插件等，以实现DeepSeek的集成。用户可以访问DeepSee...

samool

2025 年 01 月 28 日

暂无评论

OpenAI GPT-4 多个引擎版本之间的区别是什么？

OpenAI GPT-4的不同版本包括gpt-4o系列（轻量和标准版，优化模型体积和速度），gpt-4-turbo系列（加速版，快速响应），以及gpt-4系列（完整版，高准确度）。预览版用于测试新功能。这些版本在性能、速度和资源消耗上有所不同，价格也有所差异，GPT-4o系列价格较低，GPT-4 T...

samool

2024 年 10 月 21 日

暂无评论

20个中国大模型盘点，多个开源项目

随着AI大模型开发浪潮的兴起，中国科技公司、学术研究机构和高校纷纷发布了自己的大模型产品，开启了“百模大战”时代。这些模型涵盖了金融、科技、电商、医疗、法律等多个行业，部分模型如清华大学的ChatGLM-6B、智源人工智能研究院的悟道·天鹰等为开源项目，允许商业化，方便企业和个人开发者打造自己的生成...

samool

2024 年 03 月 20 日

暂无评论