🏷️ efficiency

1 articles about 'efficiency'

δ-mem: Cutting LLM Memory Costs by 90%

2026-05-17 research 👁 13

New δ-mem framework slashes GPU memory usage for LLMs by 90%, enabling efficient online inference on consumer hardware.