llm

Star

Here are 90 public repositories matching this topic...

SJTU-IPADS / PowerInfer

Star

High-speed Large Language Model Serving on PCs with Consumer-grade GPUs

falcon llama large-language-models llm local-inference llm-inference bamboo-7b

Updated Sep 6, 2024
C++

LostRuins / koboldcpp

Star

Run GGUF models easily with a KoboldAI UI. One File. Zero Install.

llama language-model gemma mistral koboldai llm llamacpp ggml koboldcpp gguf

Updated Dec 2, 2024
C++

b4rtaz / distributed-llama

Sponsor

Star

Tensor parallelism is all you need. Run LLMs on an AI cluster at home using any device. Distribute the workload, divide RAM usage, and increase inference speed.

neural-network distributed-computing llm llms open-llm llm-inference llama2 distributed-llm llama3

Updated Nov 21, 2024
C++

RWKV / rwkv.cpp

Star

INT4/INT5/INT8 and FP16 inference on CPU for RWKV language model

machine-learning deep-learning quantization language-model llm rwkv ggml

Updated Aug 7, 2024
C++

myscale / MyScaleDB

Star

A @ClickHouse fork that supports high-performance vector search and full-text search.

search-engine sql big-data image-search ann embedding similarity-search rag vector-search llm vectordb myscaledb sql-vector unstructured-analytics

Updated Nov 14, 2024
C++

MegEngine / InferLLM

Star

a lightweight LLM model inference framework

mobile inference deeplearning llm

Updated Apr 7, 2024
C++

alibaba / rtp-llm

Star

RTP-LLM: Alibaba's high-performance LLM inference engine for diverse applications.

inference llama gpt model-serving llm llmops llm-serving

Updated Oct 14, 2024
C++

tenstorrent / tt-metal

Star

🤘 TT-NN operator library, and TT-Metalium low level kernel programming model.

metal accelerator ml resnet llama low-level-programming mistral llm stable-diffusion mixtral tenstorrent

Updated Dec 3, 2024
C++

ngxson / wllama

Star

WebAssembly binding for llama.cpp - Enabling on-browser LLM inference

webassembly wasm llama llm llamacpp

Updated Dec 1, 2024
C++

foldl / chatllm.cpp

Star

Pure C++ implementation of several models for real-time chatting on your computer (CPU)

llm llm-inference

Updated Nov 29, 2024
C++

vectorch-ai / ScaleLLM

Star

A high-performance inference system for large language models, designed for production environments.

performance gpu model production cuda efficiency inference transformer llama speculative serving llm llm-inference llama3

Updated Nov 21, 2024
C++

intel / xFasterTransformer

Star

intel inference transformer xeon llama model-serving llm chatglm qwen

Updated Nov 25, 2024
C++

turing-machines / mentals-ai

Star

Agents in Markdown syntax (loops, memory and tools included)

cli machine-learning terminal ai artificial-intelligence openai gpt ai-agents llm llama3 gpt-4o

Updated Sep 13, 2024
C++

mybigday / llama.rn

Star

React Native binding of llama.cpp

android ios react-native llama llm llama-cpp

Updated Nov 21, 2024
C++

zjhellofss / KuiperLLama

Star

校招、秋招、春招、实习好项目，带你从零动手实现支持LLama2/3和Qwen2.5的大模型推理框架。

cpp cuda inference-engine llm llm-inference llama2 qwen qwen2 llama3

Updated Nov 5, 2024
C++

yoshoku / llama_cpp.rb

Sponsor

Star

llama_cpp provides Ruby bindings for llama.cpp

ruby gem ai llama llm

Updated Sep 16, 2024
C++

trzy / llava-cpp-server

Star

LLaVA server (llama.cpp).

llama multimodal vision-transformer llm llava llama2

Updated Oct 20, 2023
C++

awa-ai / awadb

Star

AI Native database for embedding vectors

embedding-vectors aigc llm ai-native chatgpt vectordb

Updated Nov 4, 2024
C++

mgonzs13 / llama_ros

Star

llama.cpp (GGUF LLMs) and llava.cpp (GGUF VLMs) for ROS 2

cpp embeddings llama gpt ros2 vlm reranking llm langchain llava llamacpp ggml gguf rerank llavacpp

Updated Dec 3, 2024
C++

gotzmann / booster

Star

Booster - open accelerator for LLM models. Better inference and debugging for AI hackers

openai llama gpt llm chatgpt llamacpp llama-cpp vllm ggml exllama oobabooga ollama

Updated Aug 15, 2024
C++

Improve this page

Add a description, image, and links to the llm topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the llm topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

llm

Here are 90 public repositories matching this topic...

SJTU-IPADS / PowerInfer

LostRuins / koboldcpp

b4rtaz / distributed-llama

RWKV / rwkv.cpp

myscale / MyScaleDB

MegEngine / InferLLM

alibaba / rtp-llm

tenstorrent / tt-metal

ngxson / wllama

foldl / chatllm.cpp

vectorch-ai / ScaleLLM

intel / xFasterTransformer

turing-machines / mentals-ai

mybigday / llama.rn

zjhellofss / KuiperLLama

yoshoku / llama_cpp.rb

trzy / llava-cpp-server

awa-ai / awadb

mgonzs13 / llama_ros

gotzmann / booster

Improve this page

Add this topic to your repo