一个轻量级框架,专为在本地计算机(如Windows、macOS、Linux甚至移动设备)上高效运行和管理大型语言模型(如Llama 3、Mistral、Gemma等)而设计。