Add token-id LM training, CUDA defaults, and kernel launch hygiene by wadkisson · Pull Request #11 · lean-dojo/TorchLean

wadkisson · 2026-07-02T01:41:15Z

Summary

Three library changes

Part A — Token-id causal LM API

Add causalTransformerTokenLmScalarModuleDef for float-encoded token-id inputs
Add text helpers: causalLmTokenRows, causalLmTokenFloatVec, causalLmTokenSampleRowsFromTokenArray
Add floatVecToNatTensor op (Functional → Ops → TorchLean Functional → Trainer instances)
Add verifier stubs in Compile.lean and SpecEval.lean

Enables persistent-module LM training: token windows can change each step without rebuilding the module or one-hot tensors (Adam state stays on one session). Matches PyTorch nn.Embedding + cross_entropy structurally.

Part B — CUDA CLI + inference

--cuda auto-enables --fast-kernels (fastKernels := fastKernels || useGpu)
Add Options.noGrad; eval1NoGrad sets noGrad := true
README: CUDA quickstart no longer requires explicit --fast-kernels

Makes --cuda turn on fast kernels by default and fixes inference so eval1NoGrad runs without recording autograd state.

Part C — Native CUDA robustness

Add torchlean_cuda_clear_pending_error and torchlean_cuda_check_launch
Use before scalar unary kernel launches and in reduceMean

Clears stale CUDA driver errors before kernel launches so unrelated failures don’t break TorchLean’s native kernels.

Token-id causal LM API for persistent-module training; --cuda enables fast-kernels by default; noGrad for eval1NoGrad; clear stale CUDA errors before kernel launches.

wadkisson added 2 commits July 1, 2026 18:14

Add token-id LM training, CUDA defaults, and kernel launch hygiene.

02cb99a

Token-id causal LM API for persistent-module training; --cuda enables fast-kernels by default; noGrad for eval1NoGrad; clear stale CUDA errors before kernel launches.

Merge branch 'lean-dojo:main' into main

cda984e

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add token-id LM training, CUDA defaults, and kernel launch hygiene#11

Add token-id LM training, CUDA defaults, and kernel launch hygiene#11
wadkisson wants to merge 2 commits into
lean-dojo:mainfrom
wadkisson:main

wadkisson commented Jul 2, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Uh oh!

Conversation

wadkisson commented Jul 2, 2026

Summary

Part A — Token-id causal LM API

Part B — CUDA CLI + inference

Part C — Native CUDA robustness

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant