<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>开源 on 阳明的博客</title>
    <link>https://www.qikqiak.com/tags/%E5%BC%80%E6%BA%90/</link>
    <description>Recent content in 开源 on 阳明的博客</description>
    <generator>Hugo</generator>
    <language>en-us</language>
    <lastBuildDate>Tue, 17 Dec 2024 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.qikqiak.com/tags/%E5%BC%80%E6%BA%90/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>GPUStack：打造企业级私有大模型服务的开源利器</title>
      <link>https://www.qikqiak.com/post/gpustack-introduction/</link>
      <pubDate>Tue, 17 Dec 2024 00:00:00 +0000</pubDate>
      <guid>https://www.qikqiak.com/post/gpustack-introduction/</guid>
      <description>&lt;p&gt;最近，一个国产开源项目凭借高质量的代码、飞快的迭代速度和简洁友好的操作体验正在悄然崛起。短短半年内，这个项目已经在国内外开源社区获得了众多的拥趸和生产用户。它就是今天要介绍的开源项目 - &lt;strong&gt;GPUStack&lt;/strong&gt;。&lt;/p&gt;&#xA;&lt;p&gt;&lt;img src=&#34;https://picdn.youdianzhishi.com/images/1734438885545.png&#34; alt=&#34;GPUStack&#34;&gt;&lt;/p&gt;&#xA;&lt;p&gt;&lt;code&gt;GPUStack&lt;/code&gt; 是一个 100% 开源的大模型服务平台，用户只需要简单的设置，就可以高效整合包括 NVIDIA、Apple Metal、华为昇腾和摩尔线程在内的各种异构 GPU/NPU 资源，构建异构 GPU 集群，在私有环境提供企业级的大模型部署解决方案。&lt;/p&gt;&#xA;&lt;p&gt;&lt;code&gt;GPUStack&lt;/code&gt; 支持私有化部署 RAG 系统和 AI Agent 系统所需的各种关键模型，包括 LLM 大语言模型、VLM 多模态模型、Embedding 文本嵌入模型、Rerank 重排序模型、Text-to-Image 文生图模型，以及 Speech-to-Text（STT）和 Text-to-Speech（TTS）语音模型等。并提供统一认证和高可用负载均衡的 OpenAI 兼容 API，供用户从各类大模型云服务无缝迁移到本地部署的私有大模型服务。&lt;/p&gt;&#xA;&lt;blockquote&gt;&#xA;&lt;p&gt;GitHub：&lt;strong&gt;&lt;a href=&#34;https://github.com/gpustack/gpustack&#34;&gt;https://github.com/gpustack/gpustack&lt;/a&gt;&lt;/strong&gt;&lt;/p&gt;&#xA;&lt;/blockquote&gt;</description>
    </item>
  </channel>
</rss>
