diff --git a/TASK.md b/TASK.md index d3804e1..005c467 100644 --- a/TASK.md +++ b/TASK.md @@ -99,7 +99,8 @@ - [x] Real-ESRGAN Core ML 集成架构 - [x] AIEnhancer 模块:公共 API 和配置 - [x] RealESRGANProcessor:Core ML 推理逻辑 - - [x] TiledImageProcessor:分块处理(内存优化) + - [x] TiledImageProcessor:真正的分块处理(512×512 tiles,64px 重叠,加权混合拼接) + - [x] WholeImageProcessor:小图处理(≤512×512 使用整图缩放) - [x] ImageFormatConverter:格式转换工具 - [x] LivePhotoCore 集成 - [x] ExportParams 扩展 aiEnhanceConfig @@ -120,14 +121,32 @@ - [ ] 包体积优化 - [ ] 使用 INT8 量化模型(预估可从 64MB 降至 ~16MB) - [ ] 或使用 On-Demand Resources 按需下载模型 -- [ ] 性能优化 - - [ ] 尝试使用支持灵活输入尺寸的模型(避免缩放损失) +- [x] AI 增强质量优化(已完成 ✅) + - [x] 真正的分块处理:将大图拆分为 512×512 tiles,分别推理后拼接 + - [x] 64px 重叠区域 + 线性权重混合,消除接缝 + - [x] 自动选择处理器:大图用 TiledImageProcessor,小图用 WholeImageProcessor + - [x] 信息损失从 ~86% 降至 0%(1080×1920 图像不再压缩) +- [ ] 高级合成功能(照片+视频合成 Live Photo) + - [ ] 双导入入口:支持分别选择静态照片和视频 + - [ ] 尺寸对齐逻辑:照片自动 match 视频尺寸 + - [ ] resolveKeyPhotoURL 扩展:支持外部照片输入 + - [ ] UI 设计:照片裁剪/对齐预览 +- [ ] 其他性能优化 + - [ ] 尝试使用支持灵活输入尺寸的模型(EnumeratedShapes) - [ ] 探索 Metal Performance Shaders 替代方案 --- -## 决策备忘(后续需要你拍板) +## 决策备忘(已完成 ✅) -- [ ] HDR 默认策略:默认转 SDR vs 首次提示用户选择 -- [ ] 编码兜底策略:完全自动兜底 vs 失败后提示开启兼容模式 -- [ ] 高级合成(照片+视频)进入哪个阶段(建议 M2) +- [x] **HDR 默认策略**:✅ 保持默认转 SDR + - 理由:Live Photo 壁纸场景下 SDR 显示更稳定,避免 HDR 在不同设备/亮度下显示不一致 + - 后续:M5 可在设置页添加"高级选项"供专业用户切换 + +- [x] **编码兜底策略**:✅ 保持完全自动兜底 + - 理由:符合"Just Works"理念,诊断系统已能提前识别风险并建议兼容模式 + - 可选改进:ProcessingView 显示"使用兼容模式编码中..."提升透明度 + +- [x] **高级合成功能**(照片+视频):✅ 延后到 M5 或 M6 + - 理由:属于高级功能,非核心需求,当前专注上线 M0-M4 + - 技术要点:双导入入口、尺寸对齐逻辑、resolveKeyPhotoURL 扩展