close
Skip to content
View Ferraronp's full-sized avatar

Block or report Ferraronp

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
Ferraronp/README.md

Артур

LLM-инженерия: агенты, файн-тюнинг, инференс, пайплайны.
~10 лет в программировании. Большинство вещей строю с нуля — иначе непонятно, как оно работает.


Проекты

Серия русскоязычных языковых моделей, обученных с нуля на собственном корпусе (~12B токенов).
Архитектура эволюционировала от GPT-2 Small до кастомной реализации с RoPE, RMSNorm, SwiGLU, GQA, Flash Attention (~700M параметров).
Распределённое обучение реализовано через несколько Colab-воркеров с ручной синхронизацией градиентов.

API-сервис для анализа КБЖУ по фотографии блюда.
Трёхэтапный пайплайн: Qwen2.5-VL-7B описывает состав → LLM извлекает ингредиенты и ищет в Open Food Facts → финальная сборка JSON.
Батч-менеджер, load balancer для нескольких Colab-инстансов, мониторинг GPU-памяти.

Чат-бот с двухэтапным RAG-пайплайном: малая модель фильтрует чанки из веб-страниц, большая формулирует ответ.
Playwright с JS-оверрайдами для обхода антибот-защиты, параллельная обработка до 5 потоков.

Утилита для визуализации метрик обучения llm.c в реальном времени. Live-режим и разовый импорт готового лога.


Open Source

FunAudioLLM/CosyVoice #1872 — llama-cpp-python backend для CosyVoice3.
Интеграция GGUF-инференса через llama-cpp-python: ~2.6x ускорение RTF на T4 vs PyTorch fp16. Конвертер и кванты: HuggingFace.

karpathy/llm.c #828 — баг-фикс в C-даталоадере.
Python-сторона допускала датасеты до 4GB, C-сторона тихо переполнялась на >2GB из-за каста (int) в fseek. Убрал downcast.


Стек

Область Инструменты
LLM PyTorch · Transformers · bitsandbytes · PEFT / LoRA
Инференс vLLM · GGUF / llama.cpp
Данные tiktoken · SimHash · Playwright · datasets (HF)
Бэкенд FastAPI · Docker · PostgreSQL

Контакты

Pinned Loading

  1. gpt-pretrain gpt-pretrain Public

    Pretraining Russian GPT from scratch — RoPE, SwiGLU, GQA, distributed training across free Colab instances

    Python

  2. vlm-nutrition-analyzer vlm-nutrition-analyzer Public

    Food nutrition analysis API: photo → VLM (Qwen2.5-VL) + LLM (Llama 3.3) + Open Food Facts → calories & macros per ingredient

    Python