A Real-World Radio Frequency Signal Dataset Based on LTE System and Variable Channels
قاعدة بيانات لإشارات التردد الراديوي من العالم الحقيقي تعتمد على نظام LTE وقنوات متغيرة
A Real-World Radio Frequency Signal Dataset Based on LTE System and Variable Channels
المؤلفون: Shupeng Zhang, Yibin Zhang, Xixi Zhang, Jinlong Sun, Yun Lin*, Haris Gacanin#, Fumiyuki Adachit, and Guan Gui
جهة العمل: كلية هندسة الاتصالات والمعلومات، جامعة نانجينغ للبريد والاتصالات (NJUPT)، نانجينغ، الصين. * كلية هندسة المعلومات والاتصالات، جامعة هاربين للهندسة، هاربين، الصين. # معهد تقنيات الاتصال والأنظمة المدمجة، جامعة RWTH آخن، آخن، ألمانيا. معهد الأبحاث الدولي لعلوم الكوارث (IRIDES)، جامعة توهوكو، سنداي، اليابان.
الملخص (Abstract)
تمتلك تقنية تحديد بصمة التردد الراديوي (Radio Frequency Fingerprint - RFF) القائمة على التعلم العميق (Deep Learning) القدرة على تعزيز أداء الأمان في الشبكات اللاسلكية. مؤخراً، تم اقتراح العديد من قواعد بيانات RFF لتلبية متطلبات قواعد البيانات واسعة النطاق. ومع ذلك، فإن معظم هذه القواعد جُمعت من أجهزة WiFi بتردد 2.4 جيجاهرتز وعبر بيئات قنوات متشابهة. علاوة على ذلك، اقتصرت تلك القواعد على توفير بيانات الاستقبال التي جُمعت بواسطة معدات محددة. تستخدم هذه الورقة البحثية الأجهزة الطرفية للراديو البرمجي كمنصة لتوليد قاعدة البيانات. وبناءً عليه، يمكن للمستخدم تخصيص معلمات قاعدة البيانات، مثل نطاق التردد (Frequency Band)، ونمط التضمين (Modulation Mode)، وكسب الهوائي (Antenna Gain)، وما إلى ذلك. بالإضافة إلى ذلك، تم إنشاء قاعدة البيانات المقترحة عبر بيئات قنوات متنوعة ومعقدة، تهدف إلى تمثيل إشارات التردد الراديوي في العالم الحقيقي بشكل أفضل. لقد قمنا بجمع البيانات عند أجهزة الإرسال وأجهزة الاستقبال لمحاكاة قاعدة بيانات RFF واقعية تعتمد على نظام التطور طويل الأمد (Long-Term Evolution - LTE). علاوة على ذلك، قمنا بالتحقق من قاعدة البيانات وتأكيد موثوقيتها.
الكلمات المفتاحية: قاعدة بيانات RFF، الأجهزة الطرفية للراديو البرمجي، العالم الحقيقي، التعلم العميق، تحديد هوية الأجهزة.
1. المقدمة (INTRODUCTION)
مع التقدم المستمر في الاتصالات اللاسلكية، أصبح تطبيق إنترنت الأشياء (Internet of Things - IoT) جزءاً لا يتجزأ من الحياة اليومية. وفي الوقت نفسه، تتزايد الهجمات السيبرانية مثل هجمات الانتحال (Impersonation Attacks)، حيث يتمكن المخترق من تكرار معلومات الهوية لخداع الأجهزة. لذا، أصبح أمن الاتصالات اللاسلكية قضية حيوية.
تُعد بصمة التردد الراديوي (Radio Frequency Fingerprinting - RFF) تقنية لتحديد هوية الأجهزة اللاسلكية وتعزيز أمن الاتصالات. وتتمثل RFF في الخصائص الناتجة عن العيوب المادية في الدوائر التناظرية (Hardware Imperfections)، والتي تنشأ أثناء عملية التصنيع؛ مما يجعلها فريدة وقابلة للتطبيق في تحديد هوية الأجهزة.
يوضح الشكل 1 المراحل الرئيسية في عملية تحديد RFF.
الشكل 1: تحديد هوية الأجهزة باستخدام بصمة التردد الراديوي (RFF).
2. نموذج النظام (SYSTEM MODEL)
أ. نظام الاتصالات اللاسلكية المعتمد على LTE
يوفر نظام LTE تغطية أفضل وسعة نظام محسنة وإشارات ذات قيمة ذروة عالية بكفاءة. يتم توليد بيانات مصدر الإشارة على الحاسوب ومعالجتها بناءً على معايير LTE. كما هو موضح في الشكل 2، تتلخص المراحل التفصيلية للنظام فيما يلي:
-
توليد المصدر (Generate source): تم استخدام 18 دقيقة من ملف MP3 وتشفيره بنظام PCM لإنتاج بيانات المصدر.
-
ترميز القناة (Channel code): تم استخدام ترميز تلافيفي (Convolutional Code) بنسبة 1/2 لتعزيز الكفاءة.
-
تخطيط التضمين (Modulation mapping): نوع التضمين المستخدم هو 16QAM (16 Quadrature Amplitude Modulation).
-
توليد الإشارة المرجعية (Generate pilot): توليد إشارتين مرجعيتين لتقدير القناة عند جهاز الاستقبال.
-
تخطيط الموارد (Resource mapping): ربط الإشارات الرقمية بترددات وأزمنة موجات كهرومغناطيسية محددة.
-
تحويل فورير السريع العكسي (IFFT): لتحويل البيانات من المجال الترددي إلى المجال الزمني.
-
إضافة البادئة الدورية (Add CP): للتخلص من التداخل بين الموجات الحاملة (ICI) والتداخل بين الرموز (ISI).
تُعطى إشارة RF بعد الرفع الترددي (Up-conversion) بالمعادلة التالية:
حيث يمثل إشارة النطاق الأساسي (Baseband signal)، و هو التردد الحامل لجهاز الإرسال.
الجدول 1: معلمات النظام والقيم الافتراضية.
| معلمة النظام | الإعداد الافتراضي |
|---|---|
| نوع التضمين (Modulation type) | 16QAM |
| نوع ترميز القناة (Channel coding type) | 1/2 convolutional code |
| نسبة الإشارة إلى الضوضاء (SNR) | 20 dB |
| تردد الإرسال (Transmission frequency) | 800 MHz |
| تردد الاستقبال (Reception frequency) | 800 MHz |
3. نهج توليد قاعدة البيانات (DATASET GENERATION APPROACH)
أ. بيئة القناة (Channel Environment)
تم تصميم نوعين من بيئات القنوات في المختبر لمحاكاة الواقع:
-
قناة خط البصر (Line of Sight - LOS): حيث تنتقل الإشارة في خط مستقيم دون عوائق.
-
قناة غير خط البصر (Non-Line of Sight - NLOS): حيث تتعرض الإشارة للانعكاس والتشتت والحيود بسبب وجود عوائق وأشخاص يتحركون.
ب. إعدادات الأجهزة (Hardware Setup)
-
معدات استقبال الإشارة: تم استخدام منصات XSRP، وهي منصات راديو معرف برمجيًا (Software Defined Radio - SDR).
-
معدات معالجة الإشارة: حواسيب مزودة بمعالجات Intel Core i7 وذاكرة 16 جيجابايت.
4. تحليل قاعدة البيانات والتحقق منها (DATASET ANALYSIS AND VERIFICATION)
تم التحقق من موثوقية قاعدة البيانات باستخدام شبكة عصبية تلافيفية (CNN) بسيطة. تم تقسيم قاعدة البيانات إلى: 60% للتدريب، 20% للتحقق، و 20% للاختبار. على الرغم من أن دقة التصنيف لم تكن مثالية، إلا أنها أكدت أن قاعدة البيانات موثوقة ويمكن استخدامها في تقنيات RFF القائمة على التعلم العميق.
5. الخاتمة (CONCLUSION)
في هذه الورقة، تم اقتراح قاعدة بيانات RFF من العالم الحقيقي تأخذ في الاعتبار نظام LTE وقنوات متغيرة. تم تقديم نموذج النظام، وإعدادات الأجهزة، ونتائج الاختبار التي أكدت إمكانية استخدام قاعدة البيانات في أبحاث التعلم العميق.
قاموس المصطلحات التقنية (Glossary)
-
Radio Frequency Fingerprint (RFF): بصمة التردد الراديوي.
-
Deep Learning (DL): التعلم العميق.
-
Software Defined Radio (SDR): الراديو المعرف برمجياً.
-
Line of Sight (LOS): خط البصر.
-
Non-Line of Sight (NLOS): غير خط البصر.
-
Quadrature Amplitude Modulation (QAM): تضمين السعة المتعامد.
-
Inverse Fast Fourier Transform (IFFT): تحويل فورير السريع العكسي.
-
Cyclic Prefix (CP): البادئة الدورية.
-
Signal-to-Noise Ratio (SNR): نسبة الإشارة إلى الضوضاء.