Model Details

Domain:

Task:

Quantitative reasoning

Model Access:

Open weights (restricted use)

AI Tools Usage

This model is commonly used behind the scenes in AI tools.

Introduction

We introduce Tri-21B, our flagship large language model that redefines the efficiency frontier in LLM training. By achieving state-of-the-art performance with only 2.3T training tokens, we demonstrate that exceptional capabilities don't require excessive computational resources.

Benchmarking

FLOPs2.95e+23

Notes: 2.95E+23 FLOPs (reported) 6 FLOP/parameter/token * 20730000000 parameters * 2300000000000 tokens = 2.86074e+23 FLOP

Training

Training Code AccessibilityTrillion license (MAU are fewer than 1 million or ARR is less than $10 million USD) https://huggingface.co/trillionlabs/Tri-21B

Size Notes: 2.3T training tokens

Parameters

Parameters20730000000

Notes: 20.73B

Related ModelsView all models

Trillion-7BBy Trillion Labs

Language

Top Tasks

Top Countries

Top Domains

Top Organizations

Top Categories

Top Collections

Platform

Top Tasks

Top Countries

Top Domains

Top Organizations

Top Categories

Top Collections

Platform

Model Details

AI Tools Usage

Introduction

Benchmarking

Training

Parameters

Top Tasks

Top Countries

Top Domains

Top Organizations

Top Categories

Top Collections

Platform

Model Details

AI Tools Usage

Introduction

Benchmarking

Training

Parameters