根据自动学习技术衡量发现垃圾邮件在短信服务中的有效性

Journal of engineering sciences and information technology Pub Date : 2023-03-30 DOI:10.26389/ajsrp.n020123

أحمد أحمد عثمان, محمد بدوي مصطفى الخليفة

{"title":"根据自动学习技术衡量发现垃圾邮件在短信服务中的有效性","authors":"أحمد أحمد عثمان, محمد بدوي مصطفى الخليفة","doi":"10.26389/ajsrp.n020123","DOIUrl":null,"url":null,"abstract":"مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية، بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضاً إلى زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضًا في وقت قصير ، كما انه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية او يتم ارسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا. تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج(Naive Bayes ) وشجرة القرار((Decision Tre والغابة العشوائية Random Forest))) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة 0.99% في 0.15 ثواني.","PeriodicalId":15747,"journal":{"name":"Journal of engineering sciences and information technology","volume":"17 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-03-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"قياس فعالية نموذج اكتشاف الرسائل غير المرغوب فيها في خدمة الرسائل القصيرة استناداً على تقنيات التعلم الآلي\",\"authors\":\"أحمد أحمد عثمان, محمد بدوي مصطفى الخليفة\",\"doi\":\"10.26389/ajsrp.n020123\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية، بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضاً إلى زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضًا في وقت قصير ، كما انه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية او يتم ارسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا. تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج(Naive Bayes ) وشجرة القرار((Decision Tre والغابة العشوائية Random Forest))) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة 0.99% في 0.15 ثواني.\",\"PeriodicalId\":15747,\"journal\":{\"name\":\"Journal of engineering sciences and information technology\",\"volume\":\"17 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-03-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Journal of engineering sciences and information technology\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.26389/ajsrp.n020123\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of engineering sciences and information technology","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26389/ajsrp.n020123","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

随着移动电话的使用增加，短信服务的使用急剧增加，降低了短信成本，人们开始将短信用于宣传和不道德的活动。这也导致随机信息(Spam)急剧增加，导致个人和财务数据丢失。为了防止数据丢失，必须尽快发现随机信息。本文的目的不仅是有效地而且在短的时间内对随机信息进行分类，该研究也适用于英语国家，或者目前为止还以英语向用户发送短信。使用了一个数据集，其中包含数千条包含短信和随机短信信息。使用了自然语言处理技术和机器学习算法(分分类法、决策树和随机森林)，我们可以通过这些方法对电文的类型进行分类。应用这些算法后，randum fort的精确度在0.15秒内达到0.99%。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

قياس فعالية نموذج اكتشاف الرسائل غير المرغوب فيها في خدمة الرسائل القصيرة استناداً على تقنيات التعلم الآلي

مع زيادة استخدام الهواتف المحمولة، زاد استخدام خدمة الرسائل القصيرة بشكل هائل أدى إلى انخفاض تكلفة الرسائل النصية، بدأ الناس في استخدامها لأغراض ترويجية وأنشطة غير أخلاقية. مما أدى ذلك أيضاً إلى زيادة هائلة في الرسائل العشوائية (Spam) وبالتالي يحصل فقدان البيانات الشخصية والمالية. ولمنع فقدان البيانات من الضروري اكتشاف الرسائل العشوائية في أسرع وقت ممكن. تهدف هذه الورقة إلى تصنيف الرسائل العشوائية ليس فقط بشكل فعال، ولكن أيضًا في وقت قصير ، كما انه يعد هذا البحث قابل للتطبيق في الدول الناطقة باللغة الإنجليزية او يتم ارسال الرسائل النصية فيها للمستخدمين باللغة الإنجليزية حتى يومنا هذا. تم استخدام مجموعة بيانات تحتوي على آلاف الرسائل النصية التي تحتوي على رسائل نصية (Ham) ورسائل نصية عشوائية (Spam). تم استخدام تقنيات معالجة اللغة الطبيعية وخوارزميات تعلم الآلة (مصنف بايز الساذج(Naive Bayes ) وشجرة القرار((Decision Tre والغابة العشوائية Random Forest))) التي يمكننا من خلالها تصنيف نوع الرسالة. بعد تطبيق هذه الخوارزميات، حصلت خوارزمية Random Forest على أفضل دقة 0.99% في 0.15 ثواني.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Journal of engineering sciences and information technology

自引率

0.00%

发文量