Scan multi-serveur · 26 mai 2026 · S204 + S95 + S151 + RunPod + HF + GitHub

Le calcul distribué
de WEVAL.

Trois serveurs Linux actifs · zéro GPU NVIDIA sur les VPS · tout l'inférence LLM passe par les cascades cloud free-tier et 8+13 modèles Ollama CPU. RunPod en veille. Six spaces HuggingFace dont trois GPU. Soixante-quatre repos GitHub. L'infrastructure n'est pas spectaculaire — elle est intelligemment frugale.

3 + 1
Serveurs · état
S204 saturé · S95 calme · S151 saturé · RunPod off
87 GiB
RAM cumulée
61 + 15 + 11 GiB total
11 cores
CPU physiques
EPYC 8c + EPYC 2c + Haswell 1c
0
GPU NVIDIA local
tout LLM tourne CPU · GPU externe via HF
21
Modèles Ollama
8 sur S204 + 13 sur S151 · 37,5 GB
7
Cascades cloud
Groq · HF · NVIDIA · Cerebras · SambaNova · Mistral · Ollama
64 repos
GitHub Yacineutt
8,1 GB · 9 langages
13
HF artefacts
6 spaces · 4 datasets · 3 models
I · Le parc serveur

Trois machines actives

scan via SSH + /api/cx
26 mai 2026 · 05:17 UTC
S204 · primary
204.168.152.13 · enp7s0 10.1.0.2
Saturé · Load 13.94
Hostname
snapshot-341000228-ubuntu-16gb-hel1-1
CPU
AMD EPYC-Milan · 8 cores · 16 threads · L3 32 MiB
RAM
61 GiB · 22 used · 38 dispo · cache 36 GiB
Swap
4 GiB · 100% saturé
GPU
VirtIO 1.0 GPU (no NVIDIA)
Disque
150 GB · 134 used (90 %)
Uptime
24 jours 16h
Load
13.94 / 16 threads · 87 % saturation
Rôle
Primary · 5 098 endpoints · 24 containers · Council · cascade T0/T2
Hetzner · 16 GB · Finlande www-data dans docker · ollama · adm
S95 · WEVADS
95.216.167.89 · interne 10.1.0.3 · port 49222
Live · Load 0.36
Hostname
snapshot-356887958--16gb-hel1-1
CPU
AMD EPYC-Milan · 2 cores · 4 threads · 2.0 GHz
RAM
15 GiB · 5,5 used · 9,8 dispo
Swap
0 B (pas de swap)
GPU
aucun · pure CPU
Disque
150 GB · 117 used (82 %)
Uptime
52 jours 23h
Load
0,36 / 4 threads · 9 % saturation
Containers
anythingllm-v2 unhealthy + authentik (4) + listmonk + db
Rôle
WEVADS Arsenal :5890 · Gitea sovereign :3030 · Sentinel SSO · PostgreSQL · 30 crons
Hetzner · 16 GB · Finlande sudo NOPASSWD pour www-data
S151 · OVH
151.80.235.110 · weviamaster.ovh
Saturé 1c · Load 5.55
Hostname
ovh-tracking-server
CPU
Intel Core (Haswell) · 1 core · 1 thread
RAM
11 GiB · 7,3 used · 3,8 dispo
Swap
0 B (pas de swap)
GPU
aucun · pure CPU
Disque
97 GB · 65 used (67 %)
Uptime
41 jours 12h
Load
5,55 / 1 thread · saturé en boucle
Ollama
13 modèles · 17,5 GB on disk · 5 cloud + 8 local
Rôle
Tracking server · Ollama CPU · gpu-dispatcher D585
OVH · marqué « disabled » dans /etc/hosts S204 SSH ubuntu@151.80.235.110
RunPod · GPU on-demand
cloud · API GraphQL · key RUNPOD_API_KEY
0 pod actif
État
aucun pod actif (la veille / terminés)
Pod précédent
658qb6bwn2lzqy · RTX A5000 24 GB · 0,27 $/h
Templates
PyTorch 2.1 / 2.2 / 2.4 · CUDA 11.8 / 12.1 / 12.4 ready
Wake
D842 pause/wake automation existante
Key SSH
/var/www/.ssh/runpod_eufr1_d755
Rôle prévu
Phase 5 fine-tuning · 5 731 paires prêtes pour Colab A100 ou RunPod
API : api.runpod.io/graphql D842 wake script ready
II · Sources GPU externes

Six sources de calcul

externes au parc serveur
la majorité gratuites
groq.com · LPU
Groq
LPU custom hardware · Llama 3.3 70B à 200 ms · vitesse extrême. Tier 1 #1 de la cascade WEVIA Master.
0 € · gratuit · rate-limited
cerebras.ai · WSE
Cerebras
Wafer-Scale Engine · plus rapide encore (180 ms) · Llama-Cerebras 70B. Tier 1 #4.
0 € · gratuit · WSE-2
sambanova.ai · RDU
SambaNova
RDU dataflow chips · Llama 405B à 250 ms. Tier 1 #5 de la cascade.
0 € · gratuit · 405B max
build.nvidia.com · H100/A100
NVIDIA NIM
Nemotron 49B avec inférence H100/A100 · 500 ms. Tier 1 #3.
0 € · credits gratuits · puis pay
huggingface · 3 spaces GPU
HF Spaces
3 spaces GPU yace222 : wevia-gpu · weval-vllm · weval-brain-v4-gpu. Inférence on-demand. Probable T4/A10.
0 € · GPU community grant
colab + kaggle · A100/P100
Colab + Kaggle
A100 (Colab Pro) · P100 / T4 (Kaggle 30h/sem). Notebooks training. Phase 5 fine-tuning planifié.
0 € · manuel · session-limited
III · HuggingFace · yace222

Treize artefacts

6 spaces · 4 datasets · 3 models
huggingface.co/yace222
yace222/wevia-gpu
sdk · gradioGPU spaceinference UI
yace222/weval-vllm
sdk · gradioGPU spacevLLM serving
yace222/weval-brain-v4-gpu
sdk · dockerGPU spacebrain v4 inference
yace222/weval-ragflow
sdk · dockerRAG pipeline
yace222/weval-whisper
sdk · gradioSTT showcase
yace222/weval-mlflow
sdk · dockerML tracking
yace222/weval-brain-dataset
datasetdownloads · 22training corpus v3
yace222/weval-brain-v4-data
datasetdownloads · 10v4 training pairs
yace222/weval-training-data
datasetdownloads · 0raw corpus
yace222/weval-dr-backup
datasetdownloads · 0disaster-recovery backup
yace222/weval-brain-v3-gguf
modelGGUF quantizedlocal-runnable
yace222/weval-brain-v4
modelfine-tune v45 731 paires planifiées
yace222/weval-finetune-dataset
model · marqué datasetpairs corpus
IV · GitHub · Yacineutt

Soixante-quatre repos

8,1 GB cumulé · 9 langages
contre 17 mentionnés en mémoire

La mémoire mentionnait 17 repos publics. Le scan via le token GHP révèle 64 repos owned (publics + privés). Soit quatre fois plus que ce qu'indiquait la documentation interne. Top 25 listés ci-dessous.

Python13 PHP6 JavaScript6 HTML5 TypeScript5 Shell2 Rust1 Dockerfile1 Perl1 non spécifié24
RepoLangageTailleMajDescription
weval-consultingHTML3 211 740 KB2026-05-26Site principal weval-consulting.com · 610+ pages
gooseRust716 315 KB2026-04-25Auto-migrated from Gitea · agent CLI Rust
langflowPython543 032 KB2026-04-25LangChain visual flow builder · clone OSS
activepiecesTypeScript392 962 KB2026-04-25Workflow automation · alt Zapier
htmlHTML309 126 KB2026-05-12Auto-migrated from Gitea
weval-l99Python220 287 KB2026-05-12WEVAL safeguard backup auto · L99 957/957
difyTypeScript160 366 KB2026-04-25LLMOps platform
librechatTypeScript143 020 KB2026-04-25Multi-LLM chat UI
autogenPython120 380 KB2026-04-25Microsoft multi-agent framework
weval-enginePHP64 676 KB2026-05-20WEVIA engine repo D1000 NOWDOC fix · 2026-05-20
claw-codeTypeScript55 605 KB2026-04-25GPT-runner · agent CLI
anythingllmJavaScript49 328 KB2026-04-25RAG chat platform
antigravity-awesome-skillsPython43 557 KB2026-05-11Skills catalog
deer-flowPython24 918 KB2026-04-25SuperAgent harness research long-horizon
aiosPython21 737 KB2026-04-25AI Operating System
wevia-brainHTML18 039 KB2026-04-25Cognitive modules · nucleus prompts · deep knowledge
francyjglisboa_agent-skill-creatorPython16 855 KB2026-04-25Agent skill creator workflow
everything-claude-codeJavaScript25 777 KB2026-04-25Claude Code utilities catalog
superclaude_frameworkPython3 657 KB2026-04-25SuperClaude framework
deepagentPython2 994 KB2026-04-25Deep research context agent
weval-guardianJavaScript2 151 KB2026-05-11WEVAL guardian scripts
holyclaudeDockerfile1 808 KB2026-04-25HolyClaude framework
huggingface-skillsPython612 KB2026-04-25HF skills + apps + hf-mcp
ltx-videoPython214 KB2026-04-25LTX video generation
keyhacks162 KB2026-04-25Key hacks catalog
claude-memPython133 KB2026-04-25Claude Code auto-memory
awesome-agent-skills277 KB2026-04-25Awesome agent skills catalog
weval-archive0 KB2026-04-25Archive S157+S46 servers before Hetzner deletion (placeholder seul)
wevia-ia0 KB2026-04-25WEVIA IA Chatbot · WEVAL Consulting (placeholder)
jzocb_writing-style-skillPython11 KB2026-04-25Writing style skill
V · Archives dormantes

Cinq serveurs défunts

supprimés Hetzner avant archivage
repo weval-archive vide (placeholder)

La doctrine WEVIA.md mentionne cinq serveurs d'archives S88, S89, S46, S59, S157 comme « code legacy récupérable ». Le scan confirme qu'ils ne sont plus accessibles : pas dans /etc/hosts, pas dans known_hosts, et le repo GitHub weval-archive ne contient qu'un README de 49 octets, pas le code attendu. La marche à suivre serait de tenter une récupération via les snapshots Hetzner si existants, ou de considérer ces serveurs comme définitivement perdus.

Source : github.com/Yacineutt/weval-archive · 0 KB · description : « Archive S157 + S46 servers before Hetzner deletion »

VI · Topologie réseau

Le maillage réel

basé sur /etc/hosts + ip route + ssh paths
                                    ╭───────────────────────╮
                                    │   Cloudflare CDN+WAF  │
                                    │   zone 1488bbba…      │
                                    ╰────────────┬──────────╯
                                                 │
                          ┌──────────────────────┼──────────────────────┐
                          │                      │                      │
              ┌───────────▼────────┐  ┌──────────▼─────────┐  ┌─────────▼────────┐
              │   weval-consulting │  │ wevads.weval-...   │  │ chat.weval-...   │
              │   …com (S204)      │  │ (S95 Arsenal)      │  │ (S204 chat UI)   │
              └────────┬───────────┘  └────────┬───────────┘  └────────┬─────────┘
                       │                       │                       │
                       │                       │                       │
        ╭──────────────▼───────────╮     ╭─────▼──────────╮     ╭──────▼─────╮
        │  S204 (10.1.0.2)         │◄────┤ S95 (10.1.0.3) │     │  S204      │
        │  AMD EPYC-Milan 8c/16t   │ SSH │ EPYC 2c · 15GB │     │  endpoints │
        │  61 GB RAM · 0 GPU       │:49222 Arsenal :5890 │     │  /api/*    │
        │  load 13.94 · disk 90%   │     │ Gitea  :3030   │     ╰────────────╯
        │                          │     ╰────────────────╯
        │  Docker × 24             │
        │  Ollama :11434  8 models │     ╭────────────────╮
        │  Qdrant :6333   26 coll. │ SSH │ S151 (OVH)     │
        │  Redis  :6379   87 124 k │◄────┤ Intel Haswell  │
        │  PostgreSQL :5432        │     │ 1c · 11 GB     │
        ╰──────────────┬───────────╯     │ load 5.55      │
                       │                 │ Ollama 13 mod. │
                       │ SSH d755        │ 17.5 GB disk   │
                       ▼                 ╰────────────────╯
              ╭────────────────────╮
              │  RunPod (cloud)    │
              │  pods=[] off       │
              │  template A5000    │
              ╰────────────────────╯

  Cloud cascade (T1·1 → T1·6) ─── tous 0 € ───
  Groq · Cerebras · SambaNova · NVIDIA NIM · HuggingFace · Mistral · Ollama local

  Sources externes
  HuggingFace yace222    ─── 6 spaces + 4 datasets + 3 models
  GitHub Yacineutt       ─── 64 repos · 8,1 GB
  Colab + Kaggle         ─── A100 / P100 manuel
VII · Bilan compute

L'équation finale

3 VPS · 0 GPU · 7 cascades · 4 sources externes

Aucun GPU NVIDIA sur le parc serveur. Les trois VPS Linux sont purement CPU. Tout le traitement LLM passe soit par les cascades cloud free-tier (Groq, Cerebras, SambaNova, NVIDIA NIM, Mistral, HuggingFace, OpenRouter) — 200 à 500 ms de latence, zéro euro — soit par Ollama CPU local sur S204 (8 modèles) et S151 (13 modèles dont 5 cloud-routed). C'est une architecture volontairement frugale : la souveraineté ne vient pas d'avoir des GPU à soi, elle vient d'avoir sept cascades parallèles dont aucune ne peut être coupée individuellement.

Pour le fine-tuning ou les charges lourdes, trois portes restent ouvertes : HuggingFace Spaces GPU (3 spaces yace222 actifs), RunPod RTX A5000 (template prêt, wake en 2 minutes via D842), et Colab/Kaggle (A100/P100 manuel). Les 5 731 paires de fine-tuning préparées attendent l'un de ces trois canaux.

Le maillage GitHub est plus dense que ne le disait la documentation : 64 repos owned (et non 17), 8,1 GB cumulés, dont les clones forks OSS lourds (Goose 716 MB, Langflow 543 MB, Activepieces 392 MB, Dify 160 MB, LibreChat 143 MB, Autogen 120 MB). Le code source de WEVAL — weval-consulting, weval-engine, weval-l99, wevia-brain, antigravity-awesome-skills — est dispersé sur huit repos propres, totalisant environ 3,8 GB de code propriétaire.