Edit Banana: الدليل الشامل لتحويل الرسوم البيانية الثابتة إلى مخططات قابلة للتعديل

كل باحث ومحلل واجه هذا الموقف المحبط: تجد الرسم البياني المثالي في ملف PDF لكن لا يمكنك تعديله. Edit Banana يحل هذه المشكلة باستخدام SAM 3 ونماذج لغوية كبيرة متعددة الوسائط لتحويل الصور الثابتة إلى ملفات DrawIO (XML) وPowerPoint (PPTX) قابلة للتعديل بالكامل.
تم تطويره بواسطة BIT-DataLab (معهد بكين للتكنولوجيا)، مع أكثر من 3,800 نجمة على GitHub و233 فورك.
ما هو Edit Banana؟
Edit Banana هو محرر محتوى عالمي: "اجعل غير القابل للتعديل، قابلاً للتعديل." يأخذ صورة ثابتة (PNG/JPG) أو PDF ويُنتج ملفاً قابلاً للتعديل حيث يمكن سحب كل عنصر وتنسيقه وتعديله بشكل فردي.
إحصائيات المشروع
| المقياس | القيمة |
|---|---|
| نجوم GitHub | +3,800 |
| الفوركات | 233 |
| اللغة | Python |
| الترخيص | AGPL-3.0 |
| تاريخ الإنشاء | يناير 2026 |
| عرض تجريبي | editbanana.anxin6.cn |
كيف يعمل: خط الأنابيب
المرحلة 1: الإدخال
صور PNG/JPG أو ملفات PDF تحتوي على رسوم بيانية أو مخططات.
المرحلة 2: التجزئة بـ SAM 3
مفكك أقنعة SAM 3 مُعدَّل يحدد كل عنصر: أشكال، خطوط، أسهم، مناطق نص، تعبئات ألوان.
المرحلة 3: استخراج النص (متوازي)
- OCR محلي (Tesseract) — تحديد النص القياسي، يعمل بدون إنترنت
- Pix2Text — التعرف على الصيغ الرياضية وتحويلها إلى LaTeX
- استراتيجية القص الموجه — إرسال مقاطع عالية الدقة لمحرك النص
المرحلة 4: مسح VLM متعدد الجولات
نموذج LLM متعدد الوسائط (Qwen-VL/GPT-4V) يحلل العلاقات المنطقية واتجاه التدفق والتسلسل الهرمي.
المرحلة 5: توليد XML/PPTX
دمج البيانات المكانية من SAM 3 ونتائج OCR لإنتاج ملفات DrawIO XML أو PPTX قابلة للتعديل.
الميزات الرئيسية
- إعادة بناء عالية الدقة: منطق التخطيط، الألوان، التسلسل الهرمي، دقة النص
- تعديل فردي: كل عنصر يمكن سحبه وتغيير حجمه وتنسيقه
- دعم الصيغ الرياضية: LaTeX عبر Pix2Text
- واجهات متعددة: CLI، خادم FastAPI، عرض ويب تجريبي
- التزامن متعدد المستخدمين: قفل عام GPU + ذاكرة LRU + نظام رصيد
التثبيت
git clone https://github.com/BIT-DataLab/Edit-Banana.git
cd Image2DrawIO
mkdir -p input output sam3_output
pip install -r requirements.txt
sudo apt install tesseract-ocr tesseract-ocr-chi-sim
cp config/config.yaml.example config/config.yaml
الاستخدام
python main.py -i input/test_diagram.png
# الإخراج XML في مجلد output/
حالات الاستخدام
- البحث الأكاديمي: تعديل رسوم بيانية من منشورات بدون إعادة إنشائها
- تقارير الأعمال: استخراج رسوم بيانية من PDF إلى PowerPoint قابل للتعديل
- إنشاء المحتوى: تحويل أي رسم بياني إلى أصل قابل للتخصيص
- استرداد البيانات: إعادة بناء العناصر البصرية من تقارير قديمة
المقارنة مع البدائل
| الميزة | Edit Banana | Pic2Chart | ChartReader | WebPlotDigitizer |
|---|---|---|---|---|
| النجوم | 3.8K | N/A | +200 | N/A |
| الإدخال | صور + PDF | صور | صور | صور + PDF |
| الإخراج | DrawIO + PPTX | PPT SVG | جداول بيانات | استخراج بيانات |
| SAM 3 | ✅ | ❌ | ❌ | ❌ |
| LaTeX | ✅ | ❌ | ❌ | ❌ |
| مخطط قابل للتعديل | ✅ كل العناصر | ✅ جزئي | ❌ بيانات فقط | ❌ بيانات فقط |
الأسئلة الشائعة
ما أنواع المخططات المدعومة؟
المخططات الانسيابية، مخططات البنية، الرسوم الإحصائية، UML، خرائط ذهنية.
هل أحتاج GPU؟
GPU CUDA يُوصى به بشدة. وضع CPU ممكن لكن أبطأ بكثير.
الخلاصة
Edit Banana يمثل اختراقاً في مجال تفكيك الرسوم البيانية. بدمج تجزئة SAM 3 ونماذج LLM متعددة الوسائط ومحرك OCR مزدوج، يحوّل الصور الثابتة إلى مخططات قابلة للتعديل بالكامل مع الحفاظ على التخطيط والألوان والنص. مع أكثر من 3,800 نجمة ودعم BIT-DataLab.
