MAISON CODE .
/ AI · Search · Vectors · Innovation

التضمين المتجه: بناء محرك بحث مرئي

كيفية تنفيذ وظيفة "البحث بالصور" باستخدام OpenAI CLIP وقاعدة بيانات المتجهات (Pinecone) على Shopify.

AB
Alex B.
التضمين المتجه: بناء محرك بحث مرئي

البحث عن النص معيب. إذا كتبت “فستان صيفي أحمر منسدل”، فأنا أخمن الكلمات الرئيسية التي استخدمها التاجر. يتيح البحث المرئي للمستخدم تحميل صورة (من Instagram أو Pinterest) والقول: “ابحث لي عن شيء مثل هذا.”

التكنولوجيا: المتجهات

أجهزة الكمبيوتر لا ترى الصور. يرون الأرقام. نحن نستخدم نموذج التضمين متعدد الوسائط (مثل OpenAI CLIP) لتحويل الصور إلى قائمة أرقام (المتجهات). ومن اللافت للنظر أن الصور المتشابهة لها متجهات متشابهة رياضيًا.

الرسم البياني TD
    UserImage[صورة يقوم المستخدم بتحميلها] -->|استدعاء واجهة برمجة التطبيقات| تضمين [مقطع OpenAI]
    أداة التضمين -->|المرتجعات| VectorA[المتجه: [0.1، 0.9، 0.3...]]
    
    الكتالوج[كتالوج Shopify] -->|المعالجة المسبقة| كوز الصنوبر [قاعدة بيانات كوز الصنوبر المتجهات]
    
    VectorA -->|الاستعلام عن أقرب جار| كوز الصنوبر
    كوز الصنوبر -->|إرجاع أعلى 5| التطابقات[مطابقة وحدات SKU]
    التطابقات -->|العرض| الشبكة [شبكة المنتج]

دليل التنفيذ

الخطوة 1: فهرسة الكتالوج

نقوم بتشغيل برنامج نصي لمعالجة جميع صور المنتج.

استيراد {تضمين} من 'openai'؛
استيراد { كوز الصنوبر } من './db'؛

وظيفة غير متزامنة فهرس المنتج (المنتج) {
  تضمين const = انتظار التضمين(product.image.url);
  انتظر كوز الصنوبر.upsert({
    المعرف: معرف المنتج،
    ناقلات: التضمين،
    البيانات الوصفية: {المقبض: Product.handle}
  });
}

الخطوة الثانية: مكون واجهة المستخدم

نضيف أيقونة “الكاميرا” إلى شريط البحث. عند تحديد ملف:

  1. تحميل إلى التخزين المؤقت.
  2. قم بتمرير عنوان URL إلى طريق API الخاص بنا.
  3. قم بإجراء بحث المتجهات.
  4. أعد التوجيه إلى /search?visual_id=xyz.

حالة الاستخدام: اكتشاف النسخة المتماثلة

يرى المستخدم حقيبة يد مصممة بقيمة 5000 دولار. لا يمكنهم تحمل تكاليفها. يقومون بتحميل الصورة إلى متجرك (الذي يبيع إكسسوارات بأسعار معقولة). يعثر محركك على أقرب تطابق في الكتالوج الخاص بك ($200). التحويل الفوري.

الأداء

البحث المتجه سريع بشكل لا يصدق (O(log n)). يمكننا البحث في 100000 وحدة SKU في أقل من 50 مللي ثانية. إنه شعور سحري للمستخدم.


هل أنت مستعد للابتكار؟

البحث عن النص القياسي ممل. البحث المرئي جذاب. قم بتوظيف مهندسينا.