Prateek Jannu

Focused on building optmized inference for large language models and minimizing cost per token. Creating tools for developers. Currently working on LLmHub.dev

Beyond Work

Solo-Synth-GAN

A novel zero-shot learning model generating videos from images

LLMhub.dev

Platform optimizing large language model deployment, significantly reducing inference latency by 300ms and costs by $0.05 per API call.

How I spend time

Founder

LLmHub.dev

- all night

Machine Learning Engineer

Wavelogix, Inc

Aug 2024 - Present

Machine Learning Researcher

Purdue Research Foundation

Aug 2022 - Aug 2024

Software Engineer Praktikum

AUMA Riester GmbH & Co. KG

May 2022 - Aug 2022

Something to remember

Optimizing LLM Inference Costs and Performance

Best practices to minimize latency and maximize cost efficiency in large language model deployments.

Building Fault-Tolerant ML Pipelines

A deep dive into designing resilient, event-based ML systems with high uptime.

Barter System

Feel free to ping me at prateekjannu@gmail.com

Github

Twitter