/ sandbox / browser-llm

In-browser LLM · WebGPU

Pick a model. Download once. Runs entirely in your tab.

2 files · monaco editor↗ Open on GitHub

01 · Model19 prebuilt

Family

Size

02 · Add a modelbrowse or paste a URL

03 · Storage

// no models cached yet

$ 100% local.Models cache to your browser. No server inference, no API keys, no logs. Close the tab → it's in IndexedDB only.

chat

// session start

Pick a model on the left and hit Load. First run downloads weights (~100MB+). After that, it's instant forever.

› promptload a model first