MiniMax-Text-01 este un model lingvistic de mari dimensiuni (LLM) dezvoltat de compania chineză Minimax AI, lansat estimativ în trimestrul al treilea din 2023. Modelul este conceput pentru a susține o gamă variată de aplicații comerciale, incluzând chatbots conversaționali, generare automată de conținut, asistenți digitali și soluții enterprise bazate pe procesarea limbajului natural. Antrenat pe un corpus extins în limbile chineză și engleză, precum și pe date specializate de cod și dialog contextual, MiniMax-Text-01 reprezintă o alternativă competitivă la modelele occidentale precum GPT-3.5 și GPT-4.
Din punct de vedere arhitectural MiniMax-Text-01 este un model transformer decoder-only, optimizat pentru eficiență și latență redusă în inferență, cu o dimensiune estimată între 30 și 70 de miliarde de parametri. Utilizează tehnici avansate precum rotația pozițională (RoPE), atenția eficientă (Grouped Query Attention) și regularizare modernă în pre-antrenare. Performanțele sale sunt comparabile cu GPT-3.5 pe benchmark-uri standard, depășind în anumite teste modele open-source relevante, inclusiv în coerență, raționament contextual și generare conversațională. MiniMax-Text-01 este disponibil prin API pentru parteneri enterprise în China, fiind folosit în industrii precum educație, gaming și servicii financiare, fără o versiune open-source publică la acest moment.