Qwen3-Next Running Command

# Qwen/Qwen3-Next-80B-A3B-Thinking
```
# TP 2
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Thinking --tp 2 --reasoning-parser deepseek-r1
# TP 4
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Thinking --tp 4 --reasoning-parser deepseek-r1
# TP 8
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Thinking --tp 8 --reasoning-parser deepseek-r1
# TP 4 DP 4
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Thinking --tp 4  --dp 4 --enable-dp-attention
# TP 4 DP 4 EP 4 --reasoning-parser deepseek-r1
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Thinking --tp 4  --dp 4 --enable-dp-attention --enable-ep-moe --reasoning-parser deepseek-r1
# TP 4 + NEXTN 
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Thinking --tp 4 --speculative-num-steps 3  --speculative-eagle-topk 1  --speculative-num-draft-tokens 4 --speculative-algo NEXTN --reasoning-parser deepseek-r1
# TP 4 DP 4 + NEXTN
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Thinking --tp 4 --dp 4 --enable-dp-attention --speculative-num-steps 3  --speculative-eagle-topk 1  --speculative-num-draft-tokens 4 --speculative-algo NEXTN --reasoning-parser deepseek-r1
```
# Qwen/Qwen3-Next-80B-A3B-Instruct
```
# TP 2
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Instruct --tp 2
# TP 4
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Instruct --tp 4
# TP 8
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Instruct --tp 8
# TP 4 DP 4
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Instruct --tp 4  --dp 4 --enable-dp-attention
# TP 4 DP 4 EP 4
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Instruct --tp 4  --dp 4 --enable-dp-attention --enable-ep-moe
# TP 4 + NEXTN
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Instruct --tp 4 --speculative-num-steps 3  --speculative-eagle-topk 1  --speculative-num-draft-tokens 4 --speculative-algo NEXTN
# TP 4 DP 4 + NEXTN
python3 -m sglang.launch_server --model Qwen/Qwen3-Next-80B-A3B-Instruct --tp 4 --dp 4 --enable-dp-attention --speculative-num-steps 3  --speculative-eagle-topk 1  --speculative-num-draft-tokens 4 --speculative-algo NEXTN
```

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Qwen3-Next Running Command #10306

Qwen/Qwen3-Next-80B-A3B-Thinking

Qwen/Qwen3-Next-80B-A3B-Instruct

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Qwen3-Next Running Command #10306

Description

Qwen/Qwen3-Next-80B-A3B-Thinking

Qwen/Qwen3-Next-80B-A3B-Instruct

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions