From 946506495c13adb585f4a927874c628b3c3088cc Mon Sep 17 00:00:00 2001 From: zRzRzRzRzRzRzR <2448370773@qq.com> Date: Wed, 10 Dec 2025 23:49:45 +0800 Subject: [PATCH] install using docker --- README.md | 54 ++++++++++++++++++++++++++++++++++++++++++------ requirements.txt | 5 ++++- 2 files changed, 52 insertions(+), 7 deletions(-) diff --git a/README.md b/README.md index ba77cdd..955e0a6 100644 --- a/README.md +++ b/README.md @@ -16,13 +16,14 @@ ADB(Android Debug Bridge)来控制设备,以视觉语言模型进行屏幕 Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。系统还内置敏感操作确认机制,并支持在登录或验证码场景下进行人工接管。同时,它提供远程 ADB 调试能力,可通过 WiFi 或网络连接设备,实现灵活的远程控制与开发。 -> ⚠️ 本项目仅供研究和学习使用。严禁用于非法获取信息、干扰系统或任何违法活动。请仔细审阅 [使用条款](resources/privacy_policy.txt)。 +> ⚠️ +> 本项目仅供研究和学习使用。严禁用于非法获取信息、干扰系统或任何违法活动。请仔细审阅 [使用条款](resources/privacy_policy.txt)。 ## 模型下载地址 -| Model | Download Links | -|-------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------| -| AutoGLM-Phone-9B | [🤗 Hugging Face](https://huggingface.co/zai-org/AutoGLM-Phone-9B)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/AutoGLM-Phone-9B) | +| Model | Download Links | +|-------------------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------| +| AutoGLM-Phone-9B | [🤗 Hugging Face](https://huggingface.co/zai-org/AutoGLM-Phone-9B)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/AutoGLM-Phone-9B) | | AutoGLM-Phone-9B-Multilingual | [🤗 Hugging Face](https://huggingface.co/zai-org/AutoGLM-Phone-9B-Multilingual)
[🤖 ModelScope](https://modelscope.cn/models/ZhipuAI/AutoGLM-Phone-9B-Multilingual) | 其中,`AutoGLM-Phone-9B` 是针对中文手机应用优化的模型,而 `AutoGLM-Phone-9B-Multilingual` 支持英语场景,适用于包含英文等其他语言内容的应用。 @@ -90,8 +91,34 @@ adb devices ### 3. 启动模型服务 -1. 下载模型,并按照 `requirements.txt` 中 `For Model Deployment` 章节自行安装推理引擎框架。 -2. 通过 SGlang / vLLM 启动,得到 OpenAI 格式服务。这里提供一个 vLLM部署方案,请严格遵循我们提供的启动参数: +1. 按照 `requirements.txt` 中 `For Model Deployment` 章节自行安装推理引擎框架。 + +对于SGLang, 除了使用pip安装,你也可以使用官方docker: +> +> ```shell +> docker pull lmsysorg/sglang:v0.5.6.post1 +> ``` +> +> 进入容器,执行 +> ``` +> pip install nvidia-cudnn-cu12==9.16.0.29 +> ``` + +对于 vLLM,除了使用pip 安装,你也可以使用官方docker: +> +> ```shell +> docker pull vllm/vllm-openai:v0.12.0 +> ``` +> +> 进入容器,执行 +> ``` +> pip install -U transformers --pre +> ``` + + +**注意**: 上述步骤出现的关于 transformers 的依赖冲突可以忽略。 + +2. 在对应容器或者实体机中(非容器安装)下载模型,通过 SGlang / vLLM 启动,得到 OpenAI 格式服务。这里提供一个 vLLM部署方案,请严格遵循我们提供的启动参数: - vLLM: @@ -109,6 +136,17 @@ python3 -m vllm.entrypoints.openai.api_server \ --port 8000 ``` +- SGLang: + +```shell +python3 -m sglang.launch_server --model-path zai-org/AutoGLM-Phone-9B \ + --served-model-name autoglm-phone-9b \ + --context-length 25480 \ + --mm-enable-dp-encoder \ + --mm-process-config '{"image":{"max_pixels":5000000}}' \ + --port 8000 +``` + - 该模型结构与 `GLM-4.1V-9B-Thinking` 相同, 关于模型部署的详细内容,你也以查看 [GLM-V](https://github.com/zai-org/GLM-V) 获取模型部署和使用指南。 @@ -448,6 +486,7 @@ adb devices ``` 如果仍然无法识别,请检查: + 1. USB 调试是否已开启 2. 数据线是否支持数据传输(部分数据线仅支持充电) 3. 手机上弹出的授权框是否已点击「允许」 @@ -456,6 +495,7 @@ adb devices ### 能打开应用,但无法点击 部分机型需要同时开启两个调试选项才能正常使用: + - **USB 调试** - **USB 调试(安全设置)** @@ -472,11 +512,13 @@ adb devices 这通常意味着应用正在显示敏感页面(支付、密码、银行类应用)。Agent 会自动检测并请求人工接管。 ### windows 编码异常问题 + 报错信息形如 `UnicodeEncodeError gbk code` 解决办法: 在运行代码的命令前面加上环境变量: `PYTHONIOENCODING=utf-8` ### 交互模式非TTY环境无法使用 + 报错形如: `EOF when reading a line` 解决办法: 使用非交互模式直接指定任务, 或者切换到 TTY 模式的终端应用. diff --git a/requirements.txt b/requirements.txt index ae9e8ce..16aa426 100644 --- a/requirements.txt +++ b/requirements.txt @@ -3,9 +3,12 @@ openai>=2.9.0 # For Model Deployment +## After installing sglang or vLLM, please run pip install -U transformers again to upgrade to 5.0.0rc0. +## Any dependency conflicts related to Transformers can be ignored. + # sglang>=0.5.6.post1 -# transformers>=5.0.0rc0 # vllm>=0.12.0 +# transformers>=5.0.0rc0 # Optional: for development # pytest>=7.0.0