ورود یا عضویت

اتصال Hey Siri به n8n و OpenAI | ساخت دستیار صوتی هوشمند با Apple Shortcuts

hey siri ai assistant n8n apple shortcuts

لینک دانلود در انتهای مقاله میباشد

این گردش کار یک دستیار صوتی هوشمند مبتنی بر هوش مصنوعی است که با فرمان صوتی Hey Siri فعال می‌شود. با استفاده از Apple Shortcuts، صدای کاربر ضبط و به متن تبدیل می‌شود، سپس به n8n ارسال می‌گردد. در n8n، یک AI Agent مجهز به OpenAI درخواست را پردازش کرده و پاسخ متنی را تولید می‌کند. در نهایت پاسخ به Apple Shortcuts بازگردانده شده و Siri آن را برای کاربر می‌خواند. این گردش کار کاملاً بدون دست و آماده اجرا روی موبایل است.

کاربرد این تمپلت n8n چیست ؟

یک پزشک در مطب خصوصی: هنگام معاینه بیمار نیاز به یادداشت‌برداری سریع دارد. کافی است بگوید «Hey Siri, take a note» و تشخیص و داروهای تجویزی را دیکته کند. Siri صدا را به متن تبدیل کرده و به n8n ارسال می‌کند. AI Agent متن را ساختاریافته و در گوگل شیت یا دیتابیس ذخیره می‌کند. پزشک بدون لمس گوشی، پرونده‌سازی خودکار انجام می‌دهد.

کاربرد بهینه و پیشرفته دستیار صوتی هوشمند با Hey Siri و n8n

کاربرد پیشرفته: می‌توان به AI Agent ابزار (Tool) اختصاصی متصل کرد. مثلاً با گفتن «Hey Siri, what's my schedule today» دستیار به گوگل تقویم متصل شده و برنامه روزانه را مرور می‌کند. همچنین می‌توان از حافظه (Memory) استفاده کرد تا مکالمات چندمرحله‌ای حفظ شوند. با اضافه کردن نودهای بیشتر، می‌توان به پایگاه داده مشتریان متصل شد و سفارش‌ها را با فرمان صوتی ثبت کرد.

نود های استفاده شده در دستیار صوتی هوشمند با Hey Siri و n8n

در این بخش از همیار Ai تمامی نود های استفاده شده در تمپلت n8n دستیار صوتی هوشمند با Hey Siri و n8n بترتیب قرار گرفتن در ورک فلو بهمراه توضیحات و جایگزین های دیگر جهت توسعه بر اساس نیاز شما قرار گرفته است

مرحله 1 : دریافت‌کننده درخواست از اپل شورتکات

نوع نود : n8n-nodes-base.webhook

چرا از این نود اینجا قرار گرفته ؟

دریافت داده‌های ورودی ارسال‌شده از اپل شورتکات از طریق متد POST

چرا از این نود استفاده کردیم ؟

به عنوان نقطه ورود گردش کار، درخواست HTTP حاوی متن تبدیل‌شده از گفتار را دریافت و به گره بعدی ارسال می‌کند.

از این نود دیگه کجاها استفاده میشه ؟

  • دریافت فرمان صوتی از دستیار گوگل و پردازش در n8n
  • اتصال سنسورهای اینترنت اشیاء به n8n از طریق Webhook
  • دریافت خودکار گزارش‌های روزانه از ربات‌های تلگرام

بجای این نود میتونم از چی استفاده کنم ؟

تریگر IMAP
اگر فرمان از طریق ایمیل ارسال شود، می‌توان به جای Webhook از تریگر ایمیل استفاده کرد.
تریگر تلگرام
دریافت پیام متنی از ربات تلگرام و استفاده از آن به عنوان ورودی دستیار صوتی.

مرحله 2 : عامل هوشمند هوش مصنوعی

نوع نود : n8n-nodes-base.noOp

چرا از این نود اینجا قرار گرفته ؟

پردازش متن ورودی کاربر با استفاده از مدل زبانی و تولید پاسخ هوشمند

چرا از این نود استفاده کردیم ؟

به هسته هوشمند گردش کار تبدیل می‌شود و با درک متن ورودی، پاسخی مختصر و مناسب برای خواندن توسط سیری تولید می‌کند.

از این نود دیگه کجاها استفاده میشه ؟

  • ربات پشتیبانی مشتری که به سوالات متداول پاسخ می‌دهد
  • مشاور مالی که وضعیت بورس را تحلیل و خلاصه می‌کند
  • دستیار برنامه‌ریزی که قرار ملاقات‌ها را در تقویم ثبت می‌کند

بجای این نود میتونم از چی استفاده کنم ؟

نود Anthropic Chat Model
استفاده از مدل Claude به جای GPT-4o-mini برای پاسخ‌های تحلیلی‌تر و طولانی‌تر
نود Groq Chat Model
جایگزین رایگان و سریع برای مدل‌های LLaMA با نرخ بالای توکن در ثانیه

مرحله 3 : پاسخ به اپل شورتکات

نوع نود : n8n-nodes-base.respondToWebhook

چرا از این نود اینجا قرار گرفته ؟

ارسال پاسخ تولیدشده توسط هوش مصنوعی به اپل شورتکات

چرا از این نود استفاده کردیم ؟

برای بستن حلقه ارتباطی و ارسال نتیجه پردازش به دستگاه کاربر ضروری است تا سیری بتواند پاسخ را با صدای بلند بخواند.

از این نود دیگه کجاها استفاده میشه ؟

  • ارسال تأییدیه ثبت سفارش به درگاه پرداخت
  • بازگرداندن نتایج جستجو به ربات تلگرام
  • ارسال خروجی محاسبات به فرم وب

بجای این نود میتونم از چی استفاده کنم ؟

نود HTTP Request
اگر سرویس مقصد نیاز به ارسال پاسخ به آدرس دیگری داشته باشد، می‌توان از این نود استفاده کرد.
نود Email
در صورت نیاز به ارسال نتیجه از طریق ایمیل به جای پاسخ بلادرنگ

دانلود workflow دستیار صوتی هوشمند با Hey Siri و n8n

سوالات متداول

چطور می‌توانم از این گردش کار روی گوشی آیفون استفاده کنم؟

بعد از فعال‌سازی گردش کار در n8n، لینک Apple Shortcut موجود در یادداشت چسبان را دانلود و نصب کنید. سپس داخل اپلیکیشن Shortcuts، آدرس Webhook را با Production URL کپی‌شده از نود Webhook جایگزین کنید. حالا با گفتن «Hey Siri, AI Agent» فرمان خود را بگویید.

آیا استفاده از OpenAI هزینه دارد؟

بله، مدل GPT-4o-mini پولی است اما بسیار مقرون‌به‌صرفه است. اگر به دنبال جایگزین رایگان هستید، می‌توانید نود OpenAI را حذف و به جای آن از نود Groq با حساب رایگان استفاده کنید که مدل LLaMA را به صورت رایگان ارائه می‌دهد.

چطور می‌توانم به دستیار صوتی حافظه بدهم تا مکالمه را حفظ کند؟

می‌توانید از نود Memory یا Window Buffer Memory در تنظیمات AI Agent استفاده کنید. همچنین می‌توانید با ذخیره تاریخچه مکالمه در Airtable یا Redis و بازیابی آن در هر بار اجرا، یک حافظه طولانی‌مدت سفارشی بسازید.

آیا می‌شود به جای OpenAI از مدل فارسی‌زبان استفاده کرد؟

بله، با جایگزینی نود OpenAI با نود Hugging Face Inference Model و استفاده از مدل‌های فارسی مانند 'Persian-LLaMA' یا 'gemma-2-27b-it-fa' می‌توانید پاسخ‌هایی به زبان فارسی دریافت کنید. همچنین می‌توانید از Groq با مدل LLaMA که تا حدی از فارسی پشتیبانی می‌کند، استفاده کنید.

چطور می‌توانم اطلاعات بیشتری مثل موقعیت مکانی یا آب و هوا را در اختیار AI Agent قرار دهم؟

می‌توانید یک نود HTTP Request قبل از AI Agent اضافه کنید که به یک API آب و هوا متصل می‌شود. سپس خروجی آن را به همراه متن کاربر در بخش Prompt به مدل بدهید. به این ترتیب مدل آگاه به موقعیت و شرایط جوی پاسخ می‌دهد.