فرایند اعتبار سنجی

  • 2022-07-4

چگونه یادگیری ماشین می تواند داده های شما را برای پیش بینی سهام تأیید کند

  • توسط Paul Wilcox
  • دسامبر ، 28 الگوریتمی. Algorithmi. Algorithmi. Alternativ. Model Port. Newsfeed S. Statistica. Stock Mark. unstructur.

Erez Katz ، مدیرعامل و بنیانگذار Lucena Research چگونه می تواند یادگیری ماشین داده های جایگزین را برای پیش بینی سهام تأیید کند؟بسیاری از روشهای مختلف یادگیری ماشین وجود دارد که می تواند برای پیش بینی سهام مورد استفاده قرار گیرد. چند مورد ما اخیراً در مورد استفاده از شبکه های عصبی با داده های سری زمانی بحث کردیم: - روندهای تاریخی را در شبکه های کاملاً متصل با ورودی گسترده مستقر کنید

چگونه یادگیری ماشین می تواند داده های جایگزین را برای پیش بینی سهام تأیید کند؟

بسیاری از روشهای مختلف یادگیری ماشین وجود دارد که می تواند برای پیش بینی سهام مورد استفاده قرار گیرد. چند مورد ما اخیراً در مورد استفاده از شبکه های عصبی با داده های سری زمانی بحث کردیم:

  • -روندهای تاریخی را به شبکه های کاملاً متصل با یک لایه ورودی گسترده مستقر کنید که در آن نورونهای ورودی مقادیر داده را به عنوان نقطه به زمان از زمان به زمان به مدتی در تاریخ نشان می دهند.
  • -روندهای یک بعدی را به نمایش های تصویر غنی و چند بعدی تبدیل کنید. سپس اینها می توانند توسط CNN ها برای شناسایی پیش بینی ها مستقر شوند.
  • -از RNN ها و LSTM ها استفاده کنید تا به شبکه اجازه دهید تا برای پیش بینی عملکرد مؤثر قیمت سهام ، چه داده های تاریخی را باید ذخیره یا دور ریخته شود.

چند نکته مهم که باید در مورد پیش بینی سهام توجه داشته باشید:

- تفاوت بین پیش بینی قیمت واقعی یک سهام در مقابل جهت آن (بالاتر یا پایین) بسیار مهم است.

- حتی هنگام تلاش برای پیش بینی اقدام قیمت جهت دار سهام ، ما این کار را در زمینه اقدام قیمت نسبت به یک معیار انجام می دهیم.

-به عنوان مثال ، یک حرکت قیمت سهام نسبت به S& P 500 (حرکت قیمت نسبی بازار). برای پیش بینی واقعاً قیمت سهام ممکن است چند روز یا چند ماه در آینده باشد ، این راه حل به احتمال زیاد باید مبتنی بر رگرسیون و قطعی باشد.

-با توجه به ماهیت پویا و غیر ثابت بازار ، این یک نظم بسیار بلند است (و به نظر من ، برای سرمایه گذاری های تأخیر بالا ، برعکس سرمایه گذاری های فرکانس بالا).

- تحقیقات ما در Lucena تقریباً به طور کامل در طبقه بندی اقدام قیمت متمرکز شده است (آیا سهام نسبت به موقعیت فعلی آن بالاتر خواهد بود). ما به طور معمول طبقه بندی کننده های یادگیری عمیق خود را با سایر روشهای قطعی یادگیری ماشین (عمدتا KNN ، درختان تصمیم گیری و غیره) پیش می بریم.

- تحقیق ما بر اساس دستیابی به بالاترین اهمیت آماری است. ما انتظار نداریم همیشه درست باشیم، بلکه بیشتر از اینکه اشتباه کنیم، درست باشیم.

- این موضوع برای شبکه های عصبی عمیق مبتنی بر TensorFlow (یک پلت فرم و چارچوب یادگیری عمیق منبع باز، توسعه یافته توسط Google Brain) و Keras و Theano (کتابخانه های مؤلفه منبع باز ساخته شده بر روی TenserFlow) خوب است.

- شبکه ها برای به حداقل رساندن تلفات (تفاوت بین نتیجه شبکه و دانش مطلوب و کامل، نتیجه برچسب دار) آموزش داده شده اند تا دقت و دقت را به حداکثر برسانند.

- برای داده‌های سری زمانی، ما از ویژگی‌های روزانه حمایت می‌کنیم که در طول زمان ثبت می‌شوند، اما نه لزوماً قیمت‌های روزانه سهام. تحقیقات ما بینش عملی بسیار کمی از داده‌های قیمت سهام خالص یا سایر ویژگی‌های فنی ساده (که بر اساس اطلاعات قیمت/حجم هستند) به دست آورده است.

- شبکه‌های عصبی برای ارزیابی چگونگی روند ویژگی‌های مختلف، که به عنوان امتیاز احساسات روزانه ثبت شده‌اند، در طول زمان آموزش داده شده‌اند. مهمتر از آن، شبکه‌ها چگونگی روند چندین منبع داده متعامد را در زمانی که روی هم قرار می‌گیرند (به بیان تصویری) می‌توانند ارتباط قانع‌کننده‌تری با حرکت قیمت سهام نشان دهند تا ارزیابی هر ویژگی به تنهایی.

شبکه های عصبی عمیق چقدر در تجزیه و تحلیل یک منبع داده جایگزین موثر هستند؟

فرآیند استقرار داده‌های جایگزین برای طبقه‌بندی اقدام قیمت نه تنها برای سرمایه‌گذارانی که به دنبال استقرار استراتژی‌ها هستند ارزشمند است. با افزایش داده های جایگزین، ارائه دهندگان به دنبال محققین غیر مغرضانه هستند تا آمادگی داده های خود را برای استفاده در بازارهای مالی ارزیابی و تأیید کنند. در مورد چگونگی اندازه گیری تجربی داده های جایگزین در اینجا بیشتر بخوانید.

وقتی در نظر بگیرید که چه مقدار داده برای پیش‌بینی سهام در دسترس است، می‌تواند کمی نگران‌کننده باشد. طرف خرید می‌تواند ساعت‌ها و منابع بی‌شماری را صرف جمع‌آوری و تجزیه و تحلیل داده‌ها کند تا متوجه ناتوانی آن در ارتباط با نیازهای خاص خود شود.

ماموریت ما در Lucena همیشه این بوده است که شکاف بین ارائه دهندگان داده را پر کنیم و متخصصان سرمایه گذاری جانبی را خریداری کنیم. با مسائل شناخته شده داده مانند نویز، نادرستی مشاهدات و اخبار نادرست، ما مجبور شدیم فناوری طبقه‌بندی پیشرفته‌تری ایجاد کنیم تا در ساده‌سازی فرآیند اعتبارسنجی داده‌های جایگزین مؤثرتر باشیم.

ما به خود می بالیم که به مشتریان داده خود توصیه می کنیم که چگونه داده های خود را برای مصرف کننده مالی مؤثرتر و قانع کننده تر کنند. برای این منظور، وقتی نوبت به فرآیندمان می‌رسد، ما هرگز یک «جعبه سیاه» نخواهیم بود، بنابراین بدون تأخیر بیشتر، در اینجا یک مرور کلی از نحوه کمک به صرفه‌جویی در وقت مشتریان و منابع ارزشمند ارائه شده است.

افسانه زدایی از فرآیند اعتبارسنجی داده ها

فرآیند اعتبارسنجی یک منبع داده جایگزین را می توان در مراحل زیر خلاصه کرد:

  • - دریافت داده های خام
  • - از یادگیری ماشینی برای موارد زیر استفاده کنید:
      • - نقشه

      فرآیند تبدیل داده های خام به سیگنال های عملی:

      Alternative data validation for machine learning

      محصول نهایی به ارائه دهندگان داده ما تحویل داده می شود و آنها می توانند به مشتریان خود ارائه دهند.

      تسریع فرآیند اعتبارسنجی داده ها: DQE و DME

      ما دو پلتفرم ایجاد کرده‌ایم که فرآیند اعتبارسنجی داده‌ها را تسریع می‌کنند، موتور صلاحیت داده و موتور تطبیق داده. دو پلتفرم:

      - به سرعت بلوغ اساسی یک منبع داده جایگزین را ارزیابی کنید.

      - آزمون سازگاری نوع داده، پوشش جهانی، توزیع امتیاز احساسات، سوگیری بقا، NAN ها، ناهنجاری ها و نقاط پرت.

      – نقشه داده – فرآیند تجمیع (معمولاً به سری های زمانی روزانه) و نگاشت امتیاز کل به اوراق بهادار قابل معامله.

      - تجزیه دهک قدرت سیگنال به بازده های آتی، آزمایش های برگشتی و موارد دیگر.

      - مهندس ویژگی - داده های خام را با ویژگی های مشتق شده اضافی که برای تحقیقات یادگیری ماشین مناسب تر است، تقویت کنید. به عنوان مثال: اعمال زوال زمانی، رتبه بندی نمرات در برابر جهانی از همتایان و موارد دیگر.

      - طبقه‌بندی سیگنال رویداد برای تعیین اینکه کدام ویژگی‌ها برای بالاترین ثبات قیمت در آینده با هم بهترین کار را دارند.

      Event Study Analysis for Investment Strategies

      - شبیه سازی بک تست و معاملات کاغذی - در پایان فرآیندهای اعتبار سنجی و بهبود، ما برای شبیه سازی بک تست یک استراتژی معاملاتی که سهام را بر اساس سیگنال های ارائه دهنده داده خرید و فروش می کند، آماده هستیم. هر آزمون بکآزمایی را می توان به عنوان یک سبد خرید و فروش کاغذ زنده تبدیل کرد تا سیگنال های همبستگی بازده به طور دائم در آینده آزمایش شوند.

      • علاوه بر این، Lucena یک تجزیه و تحلیل گزارش عملکرد و انتساب جامع برای ارزیابی بصری بسیار بصری ارائه می دهد.

      machine learning for investment - backtest performance

      شبیه سازی بک تست قدرت سیگنال در برابر یک معیار از پیش تعیین شدهBacktest سناریوی واقعی را با در نظر گرفتن هزینه تراکنش، لغزش و عدم اجازه نگاه کردن به آینده به دقت شبیه سازی می کند.

      اجازه ندهید تحقیقات داده منابع شما را تخلیه کند

      انفجار داده های جایگزین جدید، ابعاد جدید و هیجان انگیزی را به تحقیقات یادگیری عمیق می آورد.

      داده های موقعیت مکانی ، داده های اقدام شرکت ، احساسات رسانه های اجتماعی ، فعالیت هزینه های مصرف کننده و موارد دیگر می تواند برای ارتقاء استراتژی های سرمایه گذاری شما استفاده شود.

      با افزایش داده های جایگزین در بازار ، مشتری های طرف خرید به دنبال نحوه استقرار منابع تحقیقاتی خود هستند. Lucena با اجازه دادن به اتوماسیون مؤثر از ماده الکلی از سر و صدا و اجازه دادن به مدیران صندوق های تامینی ، بر روی آنچه امیدوار کننده ترین است ، این شکاف را از بین می برد.

      حتی پیشرفته ترین صندوق های تامینی دائماً به دنبال راه هایی برای تعیین اینکه آیا ارائه دهنده داده ارزش پیگیری دارد یا خیر. آنها می خواهند بتوانند "سریع شکست بخورند" به طوری که تحقیقات ارزشمند در مورد داده های غیرقابل قبول هدر نمی رود. همان فناوری ما برای استقرار سیگنال های پیش بینی کننده برای استراتژی های سرمایه گذاری می توان برای ارزیابی اینکه آیا یک منبع داده جایگزین حاوی اطلاعات معتبر و پیش بینی کننده است ، استفاده شود.< Pan> داده های موقعیت مکانی ، داده های اقدام شرکت ، احساسات رسانه های اجتماعی ، فعالیت هزینه های مصرف کننده و موارد دیگر می تواند برای ارتقاء استراتژی های سرمایه گذاری شما استفاده شود.

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.