ヘルスチェック
一部警告
Claude Code認証
OAuth有効 残り23時間
対策提示(関連障害グループ)
Qdrantコンテナ再起動 → docker restart qdrant-server
🟢Docker Enginerunning12 containers up
🟢database-servicerunninguptime 14d
🟢workflow-engine-1runninguptime 14d
🟢SSH接続runningホスト OK
🟢API Gatewayrunninglocal endpoint
🟢workflow-engine Workflowrunninglocal endpoint
🟢Dashboardrunninglocal endpoint
🟢Supervisor Agent Standbyrunning14 modules
🟢Ollamarunning3 models loaded
🟢VOICEVOXrunninglocal endpoint
🟢Whisperrunninglocal endpoint
🟢接続running248MB / 14 tables
🟢pg_dumprunninglast: 04:00 161MB
🟢Qdrantサーバrunninglocal endpoint
🔴Qdrant-reindexdownインデックス再構築停止中
🟢内部SSDrunning31% used
🟡Swap使用量warning0.3GB / 閾値0.5GB
🟢外付SSDrunning31% used (661GB free)
最終チェック: 2026/04/05 12:34:56
最近のインシデント
✓C2-3Qdrant接続タイムアウト12s自動2026/04/05 08:12
✓A1-2database-service OOM再起動45s自動2026/04/04 23:41
✗B2-1Ollama推論タイムアウト(30s超過)0s手動2026/04/04 15:22
✓D1-1tunnel-wfe接続断8s自動2026/04/03 19:55
✓C1-1PostgreSQL接続プール枯渇3s自動2026/04/03 07:14
✓A1-3MinIOヘルスチェック失敗15s自動2026/04/02 11:30
ナレッジ一覧
| コード | 障害内容 | 復旧手順 | 結果 | 時間 | 再利用 | 自動化 |
|---|---|---|---|---|---|---|
| C2-3 | Qdrant接続タイムアウト | docker restart qdrant-server | success | 12s | 5 | |
| A1-2 | database-service OOM再起動 | docker restart database-service | success | 45s | 3 | |
| B2-1 | Ollama推論タイムアウト | ollama serve restart | failed | 0s | 0 | |
| D1-1 | tunnel-wfe接続断 | cloudflared restart | success | 8s | 7 | |
| C1-1 | PostgreSQL接続プール枯渇 | pg_terminate idle conn | success | 3s | 2 | |
| A1-3 | MinIOヘルスチェック失敗 | docker restart minio | success | 15s | 1 |
閾値設定
system_resources
service_health
障害ログ
6件
自動復旧
health_monitor
container_restart
2026/04/05 08:12:34
Qdrant接続タイムアウト検知。コンテナ再起動実施。
復旧: docker restart qdrant-server (12秒)
自動復旧
health_monitor
oom_restart
2026/04/04 23:41:18
database-service OOM Killed検知。自動再起動。
復旧: docker restart database-service (45秒)
手動
ollama_monitor
inference_timeout
2026/04/04 15:22:05
Ollama推論30秒タイムアウト。手動介入が必要。