openwebui

leemh/openwebui

Fork 0

Commit Graph

Author	SHA1	Message	Date
MyeonghoeLee	5f5435cec7	셸 스크립트 안정성 개선 (실행 흐름 변경 없음) - stop.sh/stop-mlx.sh: kill -9 → SIGTERM 후 2초 대기, 미종료 시 SIGKILL fallback - stop-mlx.sh/stop-ollama.sh: docker ps에 2>/dev/null 추가 (Docker 미실행 시 에러 억제) - stop-ollama.sh: brew 명령어 존재 여부 체크 추가 - setup.sh: VRAM_MB 빈 값 방어 코드 추가 (set -e 크래시 방지) - setup-ollama.sh: sleep 3 → 최대 15초 readiness 체크 루프로 교체 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-31 11:17:09 +09:00
MyeonghoeLee	bcd17b2951	입출력 토큰 제한 적용 (Ollama + MLX 모두) - MLX: --use-paged-cache + --max-cache-blocks로 입력 8192 토큰 제한 - MLX: --kv-cache-quantization 기본 적용 - Ollama: Modelfile로 num_ctx(입력), num_predict(출력) 설정 - SETUP_MLX.md에 토큰 제한 설명 추가 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-25 22:32:57 +09:00
MyeonghoeLee	fe00782db1	Qwen3.5 + Open WebUI 로컬 서빙 환경 셋업 Ollama 방식과 vllm-mlx(MLX) 방식 두 가지 셋업 스크립트 및 가이드 포함. transformers fast image processor 호환성 패치 자동 적용. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-25 21:36:28 +09:00

Author

SHA1

Message

Date

MyeonghoeLee

5f5435cec7

셸 스크립트 안정성 개선 (실행 흐름 변경 없음)

- stop.sh/stop-mlx.sh: kill -9 → SIGTERM 후 2초 대기, 미종료 시 SIGKILL fallback
- stop-mlx.sh/stop-ollama.sh: docker ps에 2>/dev/null 추가 (Docker 미실행 시 에러 억제)
- stop-ollama.sh: brew 명령어 존재 여부 체크 추가
- setup.sh: VRAM_MB 빈 값 방어 코드 추가 (set -e 크래시 방지)
- setup-ollama.sh: sleep 3 → 최대 15초 readiness 체크 루프로 교체

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-03-31 11:17:09 +09:00

MyeonghoeLee

bcd17b2951

입출력 토큰 제한 적용 (Ollama + MLX 모두)

- MLX: --use-paged-cache + --max-cache-blocks로 입력 8192 토큰 제한
- MLX: --kv-cache-quantization 기본 적용
- Ollama: Modelfile로 num_ctx(입력), num_predict(출력) 설정
- SETUP_MLX.md에 토큰 제한 설명 추가

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-03-25 22:32:57 +09:00

MyeonghoeLee

fe00782db1

Qwen3.5 + Open WebUI 로컬 서빙 환경 셋업

Ollama 방식과 vllm-mlx(MLX) 방식 두 가지 셋업 스크립트 및 가이드 포함.
transformers fast image processor 호환성 패치 자동 적용.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>

2026-03-25 21:36:28 +09:00

3 Commits