LLM inference and AI infrastructure watchlist

MLSys Radar

High-signal technical posts from model labs, inference platforms, hardware teams, Korean AI infrastructure groups, open-source projects, and research labs.

High-Signal Posts935

2403 archived posts tracked

Tracked Sources72

0 successful fetches

New This Run0

0 duplicates skipped

Source Health0

failed feeds in latest run

Latest Signal2026-06-04

newest publication date

High-Signal Feed

Ranked by MLSys relevance, recency, and source quality.

Search Tag Category Language Country Source High-signal only

Moreh · korea · 2026-06-03

Optimizing Long-Context Prefill on Multiple (Older-Generation) GPU Nodes

Score 23

No feed summary available yet.

inference hardware long-context

Open

High signal Matched: prefill, generation, gpu, long-context

Moreh · korea · 2026-06-03

Moreh vLLM Performance Evaluation: DeepSeek V3/R1 671B on AMD Instinct MI300X GPUs

Score 19

No feed summary available yet.

benchmark hardware research evals

Open

High signal Matched: performance, mi300x, evaluation

Moreh · korea · 2026-06-03

Moreh vLLM Performance Evaluation: Llama 3.3 70B on AMD Instinct MI300X GPUs

Score 19

No feed summary available yet.

benchmark hardware research evals

Open

High signal Matched: performance, mi300x, evaluation

NVIDIA Dynamo · open-source · 2026-06-03

Full-Stack Optimizations for Agentic Inference

Score 19

No feed summary available yet.

inference agents

Open

High signal Matched: inference, agentic

Mooncake · open-source · 2026-06-03

vLLM Performance Benchmarks

Score 17

No feed summary available yet.

benchmark evals

Open

High signal Matched: performance, benchmarks

Mooncake · open-source · 2026-06-03

Benchmark performance on NVIDIA A10

Score 17

No feed summary available yet.

benchmark

Open

High signal Matched: benchmark, performance

Mooncake · open-source · 2026-06-03

SGLang HiCache with Mooncake Backend Benchmark

Score 17

No feed summary available yet.

kv-cache benchmark

Open

High signal Matched: hicache, benchmark

Gcore · cloud · 2026-06-03

GPU Cloud Boost AI/ML training with servers powered by NVIDIA

Score 17

No feed summary available yet.

hardware cloud training

Open

High signal Matched: gpu, cloud, training

VESSL AI · korea · 2026-06-03

Don't tie a GPU to your agent

Score 15

No feed summary available yet.

hardware agents

Open

High signal Matched: gpu, agent

VESSL AI · korea · 2026-06-03

Your GPU Credit Lifesaver: Meet VESSL Cloud Job

Score 15

No feed summary available yet.

hardware cloud

Open

High signal Matched: gpu, cloud

VESSL AI · korea · 2026-06-03

GTC 2026: GPU Infra Trends — Inference to Physical AI

Score 15

No feed summary available yet.

inference hardware

Open

High signal Matched: inference, gpu

VESSL AI · korea · 2026-06-03

Everyone Said "Sold Out" — GB200 & B300, Available Now on VESSL Cloud

Score 15

No feed summary available yet.

hardware cloud

Open

High signal Matched: gb200, cloud

VESSL AI · korea · 2026-06-03

GPU Cloud Pricing Compared: Hyperscalers vs Neoclouds (2026)

Score 15

No feed summary available yet.

hardware cloud

Open

High signal Matched: gpu, cloud

VESSL AI · korea · 2026-06-03

VESSL AI Showcases GPU Cloud Platform for Physical AI at NVIDIA GTC 2026

Score 15

No feed summary available yet.

hardware cloud

Open

High signal Matched: gpu, cloud

VESSL AI · korea · 2026-06-03

Introducing the Dashboard: Monitor Your GPU Workloads at a Glance

Score 15

No feed summary available yet.

hardware model-release

Open

High signal Matched: gpu, introducing

VESSL AI · korea · 2026-06-03

Getting Started with VESSL Cloud: Launch JupyterLab in 3 Minutes

Score 15

No feed summary available yet.

model-release cloud

Open

High signal Matched: launch, cloud

Moreh · korea · 2026-06-03

Distributed Inference on Heterogeneous Accelerators Including GPUs, Rubin CPX, and AI Accelerators

Score 15

No feed summary available yet.

inference distributed

Open

High signal Matched: inference, distributed

Moreh · korea · 2026-06-03

21K Output Tokens Per Second DeepSeek Inference on AMD Instinct MI300X GPUs with Expert Parallelism

Score 15

No feed summary available yet.

inference hardware

Open

High signal Matched: inference, mi300x

NVIDIA Dynamo · open-source · 2026-06-03

Release Artifacts

Score 15

No feed summary available yet.

model-release

Open

High signal Matched: release

NVIDIA Dynamo · open-source · 2026-06-03

Multi-Turn Agentic Harnesses

Score 15

No feed summary available yet.

agents

Open

High signal Matched: agentic

NVIDIA Dynamo · open-source · 2026-06-03

Disaggregated Serving

Score 15

No feed summary available yet.

inference serving

Open

High signal Matched: serving

NVIDIA Dynamo · open-source · 2026-06-03

KV Cache Aware Routing

Score 15

No feed summary available yet.

kv-cache

Open

High signal Matched: kv cache

NVIDIA Dynamo · open-source · 2026-06-03

KV Cache Offloading

Score 15

No feed summary available yet.

kv-cache

Open

High signal Matched: kv cache

Mooncake · open-source · 2026-06-03

SGLang Disaggregated Serving with MooncakeTransferEngine

Score 13

No feed summary available yet.

inference serving

Open

High signal Matched: serving

Mooncake · open-source · 2026-06-03

SGLang HiCache with Mooncake Backend

Score 13

No feed summary available yet.

kv-cache

Open

High signal Matched: hicache

Mooncake · open-source · 2026-06-03

Mooncake x LMCache Integration

Score 13

No feed summary available yet.

kv-cache

Open

High signal Matched: lmcache

Mooncake · open-source · 2026-06-03

LMDeploy Disaggregated Serving with MooncakeTransferEngine

Score 13

No feed summary available yet.

inference serving

Open

High signal Matched: serving

Mooncake · open-source · 2026-06-03

PD Disaggregation Performance

Score 13

No feed summary available yet.

benchmark

Open

High signal Matched: performance

Mooncake · open-source · 2026-06-03

vLLM with Mooncake Transfer Engine Benchmark

Score 13

No feed summary available yet.

benchmark

Open

High signal Matched: benchmark

Mooncake · open-source · 2026-06-03

Allocator Performance

Score 13

No feed summary available yet.

benchmark

Open

High signal Matched: performance

Mooncake · open-source · 2026-06-03

AllocationStrategy Performance

Score 13

No feed summary available yet.

benchmark

Open

High signal Matched: performance

Gcore · cloud · 2026-06-03

Everywhere AI Scalable enterprise AI training and inference across environments

Score 13

No feed summary available yet.

inference training

Open

High signal Matched: inference, training

Perplexity Research · model-lab · 2026-06-03

Rethinking Search as Code GenerationRethinking Search as Code Generation

Score 12

No feed summary available yet.

inference

Open

High signal Matched: generation

Perplexity Research · model-lab · 2026-06-03

May 20, 2026Improving Unigram Tokenizer CPU PerformanceWe reimplemented our Unigram tokenizer from scratch as a focused performance project.May 20, 2...

Score 12

No feed summary available yet.

benchmark

Open

High signal Matched: performance

Perplexity Research · model-lab · 2026-06-03

May 14, 2026Query-Aware Context Compression for Better SnippetsImproving the quality-efficiency frontier of model context through query-aware context...

Score 12

No feed summary available yet.

model-release

Open

High signal Matched: model

Perplexity Research · model-lab · 2026-06-03

researchMay 12, 2026Hosting Qwen on BlackwellresearchMay 12, 2026Hosting Qwen on BlackwellresearchMay 12, 2026Hosting Qwen on Blackwell

Score 12

No feed summary available yet.

hardware

Open

High signal Matched: blackwell

Perplexity Research · model-lab · 2026-06-03

AI Inference EngineerNew York City; Palo Alto; San Francisco

Score 12

No feed summary available yet.

inference

Open

High signal Matched: inference

Perplexity Research · model-lab · 2026-06-03

Research Residency Program

Score 12

No feed summary available yet.

research

Open

High signal Matched: research

VESSL AI · korea · 2026-06-03

Go to VESSL Cloud

Score 11

No feed summary available yet.

cloud

Open

High signal Matched: cloud

VESSL AI · korea · 2026-06-03

vesslctl: Manage VESSL Cloud from Your Terminal

Score 11

No feed summary available yet.

cloud

Open

High signal Matched: cloud

895 more high-signal posts are available in the archive.

Open full archive