Gregory-Pereira

Follow

🚀

keeping everything running

Greg Pereira Gregory-Pereira

🚀

keeping everything running

Follow

Sr. Machine Learning Engineer @ Red Hat | Inference Engineering | Building llm-d: distributed inference for LLMs on Kubernetes

45 followers · 26 following

@RedHatOfficial @llm-d
San Francisco
22:25 (UTC -07:00)
in/gregpereira1

Achievements

Achievements

Organizations

Pinned Loading

llm-d/llm-d llm-d/llm-d Public

Achieve state of the art inference performance with modern accelerators on Kubernetes

Shell 3.2k 468
kubernetes-sigs/gateway-api-inference-extension kubernetes-sigs/gateway-api-inference-extension Public

Gateway API Inference Extension

Go 667 289
vllm-project/vllm vllm-project/vllm Public

A high-throughput and memory-efficient inference and serving engine for LLMs

Python 79.8k 16.7k
deepseek-ai/DeepEP deepseek-ai/DeepEP Public

DeepEP: an efficient expert-parallel communication library

Cuda 9.6k 1.2k
llm-d/llm-d-latency-predictor llm-d/llm-d-latency-predictor Public

Latency prediction service for ML-model based scoring with llm-d-inference-scheduler

Python 2 3
llm-d-inference-scheduler llm-d-inference-scheduler Public

Forked from llm-d/llm-d-inference-scheduler

Inference scheduler for llm-d

Go