Scan multi-serveur · 26 mai 2026 · S204 + S95 + S151 + RunPod + HF + GitHub

Le calcul distribué
de WEVAL.

Trois serveurs Linux actifs · zéro GPU NVIDIA sur les VPS · tout l'inférence LLM passe par les cascades cloud free-tier et 8+13 modèles Ollama CPU. RunPod en veille. Six spaces HuggingFace dont trois GPU. Soixante-quatre repos GitHub. L'infrastructure n'est pas spectaculaire — elle est intelligemment frugale.

3 + 1

Serveurs · état

S204 saturé · S95 calme · S151 saturé · RunPod off

87 GiB

RAM cumulée

61 + 15 + 11 GiB total

11 cores

CPU physiques

EPYC 8c + EPYC 2c + Haswell 1c

GPU NVIDIA local

tout LLM tourne CPU · GPU externe via HF

Modèles Ollama

8 sur S204 + 13 sur S151 · 37,5 GB

Cascades cloud

Groq · HF · NVIDIA · Cerebras · SambaNova · Mistral · Ollama

64 repos

GitHub Yacineutt

8,1 GB · 9 langages

HF artefacts

6 spaces · 4 datasets · 3 models

I · Le parc serveur

Trois machines actives

scan via SSH + /api/cx
26 mai 2026 · 05:17 UTC

S204 · primary

204.168.152.13 · enp7s0 10.1.0.2

Saturé · Load 13.94

Hostname: snapshot-341000228-ubuntu-16gb-hel1-1
CPU: AMD EPYC-Milan · 8 cores · 16 threads · L3 32 MiB
RAM: 61 GiB · 22 used · 38 dispo · cache 36 GiB
Swap: 4 GiB · 100% saturé
GPU: VirtIO 1.0 GPU (no NVIDIA)
Disque: 150 GB · 134 used (90 %)
Uptime: 24 jours 16h
Load: 13.94 / 16 threads · 87 % saturation
Rôle: Primary · 5 098 endpoints · 24 containers · Council · cascade T0/T2

Hetzner · 16 GB · Finlande www-data dans docker · ollama · adm

S95 · WEVADS

95.216.167.89 · interne 10.1.0.3 · port 49222

Live · Load 0.36

Hostname: snapshot-356887958--16gb-hel1-1
CPU: AMD EPYC-Milan · 2 cores · 4 threads · 2.0 GHz
RAM: 15 GiB · 5,5 used · 9,8 dispo
Swap: 0 B (pas de swap)
GPU: aucun · pure CPU
Disque: 150 GB · 117 used (82 %)
Uptime: 52 jours 23h
Load: 0,36 / 4 threads · 9 % saturation
Containers: anythingllm-v2 unhealthy + authentik (4) + listmonk + db
Rôle: WEVADS Arsenal :5890 · Gitea sovereign :3030 · Sentinel SSO · PostgreSQL · 30 crons

Hetzner · 16 GB · Finlande sudo NOPASSWD pour www-data

S151 · OVH

151.80.235.110 · weviamaster.ovh

Saturé 1c · Load 5.55

Hostname: ovh-tracking-server
CPU: Intel Core (Haswell) · 1 core · 1 thread
RAM: 11 GiB · 7,3 used · 3,8 dispo
Swap: 0 B (pas de swap)
GPU: aucun · pure CPU
Disque: 97 GB · 65 used (67 %)
Uptime: 41 jours 12h
Load: 5,55 / 1 thread · saturé en boucle
Ollama: 13 modèles · 17,5 GB on disk · 5 cloud + 8 local
Rôle: Tracking server · Ollama CPU · gpu-dispatcher D585

OVH · marqué « disabled » dans /etc/hosts S204 SSH ubuntu@151.80.235.110

RunPod · GPU on-demand

cloud · API GraphQL · key RUNPOD_API_KEY

0 pod actif

État: aucun pod actif (la veille / terminés)
Pod précédent: 658qb6bwn2lzqy · RTX A5000 24 GB · 0,27 $/h
Templates: PyTorch 2.1 / 2.2 / 2.4 · CUDA 11.8 / 12.1 / 12.4 ready
Wake: D842 pause/wake automation existante
Key SSH: /var/www/.ssh/runpod_eufr1_d755
Rôle prévu: Phase 5 fine-tuning · 5 731 paires prêtes pour Colab A100 ou RunPod

API : api.runpod.io/graphql D842 wake script ready

II · Sources GPU externes

Six sources de calcul

externes au parc serveur
la majorité gratuites

groq.com · LPU

Groq

LPU custom hardware · Llama 3.3 70B à 200 ms · vitesse extrême. Tier 1 #1 de la cascade WEVIA Master.

0 € · gratuit · rate-limited

cerebras.ai · WSE

Cerebras

Wafer-Scale Engine · plus rapide encore (180 ms) · Llama-Cerebras 70B. Tier 1 #4.

0 € · gratuit · WSE-2

sambanova.ai · RDU

SambaNova

RDU dataflow chips · Llama 405B à 250 ms. Tier 1 #5 de la cascade.

0 € · gratuit · 405B max

build.nvidia.com · H100/A100

NVIDIA NIM

Nemotron 49B avec inférence H100/A100 · 500 ms. Tier 1 #3.

0 € · credits gratuits · puis pay

huggingface · 3 spaces GPU

HF Spaces

3 spaces GPU yace222 : wevia-gpu · weval-vllm · weval-brain-v4-gpu. Inférence on-demand. Probable T4/A10.

0 € · GPU community grant

colab + kaggle · A100/P100

Colab + Kaggle

A100 (Colab Pro) · P100 / T4 (Kaggle 30h/sem). Notebooks training. Phase 5 fine-tuning planifié.

0 € · manuel · session-limited

III · HuggingFace · yace222

Treize artefacts

6 spaces · 4 datasets · 3 models
huggingface.co/yace222

yace222/wevia-gpu

sdk · gradioGPU spaceinference UI

yace222/weval-vllm

sdk · gradioGPU spacevLLM serving

yace222/weval-brain-v4-gpu

sdk · dockerGPU spacebrain v4 inference

yace222/weval-ragflow

sdk · dockerRAG pipeline

yace222/weval-whisper

sdk · gradioSTT showcase

yace222/weval-mlflow

sdk · dockerML tracking

yace222/weval-brain-dataset

datasetdownloads · 22training corpus v3

yace222/weval-brain-v4-data

datasetdownloads · 10v4 training pairs

yace222/weval-training-data

datasetdownloads · 0raw corpus

yace222/weval-dr-backup

datasetdownloads · 0disaster-recovery backup

yace222/weval-brain-v3-gguf

modelGGUF quantizedlocal-runnable

yace222/weval-brain-v4

modelfine-tune v45 731 paires planifiées

yace222/weval-finetune-dataset

model · marqué datasetpairs corpus

IV · GitHub · Yacineutt

Soixante-quatre repos

8,1 GB cumulé · 9 langages
contre 17 mentionnés en mémoire

La mémoire mentionnait 17 repos publics. Le scan via le token GHP révèle 64 repos owned (publics + privés). Soit quatre fois plus que ce qu'indiquait la documentation interne. Top 25 listés ci-dessous.

Python13 PHP6 JavaScript6 HTML5 TypeScript5 Shell2 Rust1 Dockerfile1 Perl1 non spécifié24

Repo	Langage	Taille	Maj	Description
weval-consulting	HTML	3 211 740 KB	2026-05-26	Site principal weval-consulting.com · 610+ pages
goose	Rust	716 315 KB	2026-04-25	Auto-migrated from Gitea · agent CLI Rust
langflow	Python	543 032 KB	2026-04-25	LangChain visual flow builder · clone OSS
activepieces	TypeScript	392 962 KB	2026-04-25	Workflow automation · alt Zapier
html	HTML	309 126 KB	2026-05-12	Auto-migrated from Gitea
weval-l99	Python	220 287 KB	2026-05-12	WEVAL safeguard backup auto · L99 957/957
dify	TypeScript	160 366 KB	2026-04-25	LLMOps platform
librechat	TypeScript	143 020 KB	2026-04-25	Multi-LLM chat UI
autogen	Python	120 380 KB	2026-04-25	Microsoft multi-agent framework
weval-engine	PHP	64 676 KB	2026-05-20	WEVIA engine repo D1000 NOWDOC fix · 2026-05-20
claw-code	TypeScript	55 605 KB	2026-04-25	GPT-runner · agent CLI
anythingllm	JavaScript	49 328 KB	2026-04-25	RAG chat platform
antigravity-awesome-skills	Python	43 557 KB	2026-05-11	Skills catalog
deer-flow	Python	24 918 KB	2026-04-25	SuperAgent harness research long-horizon
aios	Python	21 737 KB	2026-04-25	AI Operating System
wevia-brain	HTML	18 039 KB	2026-04-25	Cognitive modules · nucleus prompts · deep knowledge
francyjglisboa_agent-skill-creator	Python	16 855 KB	2026-04-25	Agent skill creator workflow
everything-claude-code	JavaScript	25 777 KB	2026-04-25	Claude Code utilities catalog
superclaude_framework	Python	3 657 KB	2026-04-25	SuperClaude framework
deepagent	Python	2 994 KB	2026-04-25	Deep research context agent
weval-guardian	JavaScript	2 151 KB	2026-05-11	WEVAL guardian scripts
holyclaude	Dockerfile	1 808 KB	2026-04-25	HolyClaude framework
huggingface-skills	Python	612 KB	2026-04-25	HF skills + apps + hf-mcp
ltx-video	Python	214 KB	2026-04-25	LTX video generation
keyhacks	—	162 KB	2026-04-25	Key hacks catalog
claude-mem	Python	133 KB	2026-04-25	Claude Code auto-memory
awesome-agent-skills	—	277 KB	2026-04-25	Awesome agent skills catalog
weval-archive	—	0 KB	2026-04-25	Archive S157+S46 servers before Hetzner deletion (placeholder seul)
wevia-ia	—	0 KB	2026-04-25	WEVIA IA Chatbot · WEVAL Consulting (placeholder)
jzocb_writing-style-skill	Python	11 KB	2026-04-25	Writing style skill

V · Archives dormantes

Cinq serveurs défunts

supprimés Hetzner avant archivage
repo weval-archive vide (placeholder)

La doctrine WEVIA.md mentionne cinq serveurs d'archives S88, S89, S46, S59, S157 comme « code legacy récupérable ». Le scan confirme qu'ils ne sont plus accessibles : pas dans /etc/hosts, pas dans known_hosts, et le repo GitHub weval-archive ne contient qu'un README de 49 octets, pas le code attendu. La marche à suivre serait de tenter une récupération via les snapshots Hetzner si existants, ou de considérer ces serveurs comme définitivement perdus.

Source : github.com/Yacineutt/weval-archive · 0 KB · description : « Archive S157 + S46 servers before Hetzner deletion »

VI · Topologie réseau

Le maillage réel

basé sur /etc/hosts + ip route + ssh paths

                                    ╭───────────────────────╮
                                    │   Cloudflare CDN+WAF  │
                                    │   zone 1488bbba…      │
                                    ╰────────────┬──────────╯
                                                 │
                          ┌──────────────────────┼──────────────────────┐
                          │                      │                      │
              ┌───────────▼────────┐  ┌──────────▼─────────┐  ┌─────────▼────────┐
              │   weval-consulting │  │ wevads.weval-...   │  │ chat.weval-...   │
              │   …com (S204)      │  │ (S95 Arsenal)      │  │ (S204 chat UI)   │
              └────────┬───────────┘  └────────┬───────────┘  └────────┬─────────┘
                       │                       │                       │
                       │                       │                       │
        ╭──────────────▼───────────╮     ╭─────▼──────────╮     ╭──────▼─────╮
        │  S204 (10.1.0.2)         │◄────┤ S95 (10.1.0.3) │     │  S204      │
        │  AMD EPYC-Milan 8c/16t   │ SSH │ EPYC 2c · 15GB │     │  endpoints │
        │  61 GB RAM · 0 GPU       │:49222 Arsenal :5890 │     │  /api/*    │
        │  load 13.94 · disk 90%   │     │ Gitea  :3030   │     ╰────────────╯
        │                          │     ╰────────────────╯
        │  Docker × 24             │
        │  Ollama :11434  8 models │     ╭────────────────╮
        │  Qdrant :6333   26 coll. │ SSH │ S151 (OVH)     │
        │  Redis  :6379   87 124 k │◄────┤ Intel Haswell  │
        │  PostgreSQL :5432        │     │ 1c · 11 GB     │
        ╰──────────────┬───────────╯     │ load 5.55      │
                       │                 │ Ollama 13 mod. │
                       │ SSH d755        │ 17.5 GB disk   │
                       ▼                 ╰────────────────╯
              ╭────────────────────╮
              │  RunPod (cloud)    │
              │  pods=[] off       │
              │  template A5000    │
              ╰────────────────────╯

  Cloud cascade (T1·1 → T1·6) ─── tous 0 € ───
  Groq · Cerebras · SambaNova · NVIDIA NIM · HuggingFace · Mistral · Ollama local

  Sources externes
  HuggingFace yace222    ─── 6 spaces + 4 datasets + 3 models
  GitHub Yacineutt       ─── 64 repos · 8,1 GB
  Colab + Kaggle         ─── A100 / P100 manuel

VII · Bilan compute

L'équation finale

3 VPS · 0 GPU · 7 cascades · 4 sources externes

Aucun GPU NVIDIA sur le parc serveur. Les trois VPS Linux sont purement CPU. Tout le traitement LLM passe soit par les cascades cloud free-tier (Groq, Cerebras, SambaNova, NVIDIA NIM, Mistral, HuggingFace, OpenRouter) — 200 à 500 ms de latence, zéro euro — soit par Ollama CPU local sur S204 (8 modèles) et S151 (13 modèles dont 5 cloud-routed). C'est une architecture volontairement frugale : la souveraineté ne vient pas d'avoir des GPU à soi, elle vient d'avoir sept cascades parallèles dont aucune ne peut être coupée individuellement.

Pour le fine-tuning ou les charges lourdes, trois portes restent ouvertes : HuggingFace Spaces GPU (3 spaces yace222 actifs), RunPod RTX A5000 (template prêt, wake en 2 minutes via D842), et Colab/Kaggle (A100/P100 manuel). Les 5 731 paires de fine-tuning préparées attendent l'un de ces trois canaux.

Le maillage GitHub est plus dense que ne le disait la documentation : 64 repos owned (et non 17), 8,1 GB cumulés, dont les clones forks OSS lourds (Goose 716 MB, Langflow 543 MB, Activepieces 392 MB, Dify 160 MB, LibreChat 143 MB, Autogen 120 MB). Le code source de WEVAL — weval-consulting, weval-engine, weval-l99, wevia-brain, antigravity-awesome-skills — est dispersé sur huit repos propres, totalisant environ 3,8 GB de code propriétaire.

Le calcul distribuéde WEVAL.