چگونه یادگیری ماشین می تواند داده های شما را برای پیش بینی سهام تأیید کند
- توسط Paul Wilcox
- دسامبر ، 28 الگوریتمی. Algorithmi. Algorithmi. Alternativ. Model Port. Newsfeed S. Statistica. Stock Mark. unstructur.
Erez Katz ، مدیرعامل و بنیانگذار Lucena Research چگونه می تواند یادگیری ماشین داده های جایگزین را برای پیش بینی سهام تأیید کند؟بسیاری از روشهای مختلف یادگیری ماشین وجود دارد که می تواند برای پیش بینی سهام مورد استفاده قرار گیرد. چند مورد ما اخیراً در مورد استفاده از شبکه های عصبی با داده های سری زمانی بحث کردیم: - روندهای تاریخی را در شبکه های کاملاً متصل با ورودی گسترده مستقر کنید
چگونه یادگیری ماشین می تواند داده های جایگزین را برای پیش بینی سهام تأیید کند؟
بسیاری از روشهای مختلف یادگیری ماشین وجود دارد که می تواند برای پیش بینی سهام مورد استفاده قرار گیرد. چند مورد ما اخیراً در مورد استفاده از شبکه های عصبی با داده های سری زمانی بحث کردیم:
- -روندهای تاریخی را به شبکه های کاملاً متصل با یک لایه ورودی گسترده مستقر کنید که در آن نورونهای ورودی مقادیر داده را به عنوان نقطه به زمان از زمان به زمان به مدتی در تاریخ نشان می دهند.
- -روندهای یک بعدی را به نمایش های تصویر غنی و چند بعدی تبدیل کنید. سپس اینها می توانند توسط CNN ها برای شناسایی پیش بینی ها مستقر شوند.
- -از RNN ها و LSTM ها استفاده کنید تا به شبکه اجازه دهید تا برای پیش بینی عملکرد مؤثر قیمت سهام ، چه داده های تاریخی را باید ذخیره یا دور ریخته شود.
چند نکته مهم که باید در مورد پیش بینی سهام توجه داشته باشید:
- تفاوت بین پیش بینی قیمت واقعی یک سهام در مقابل جهت آن (بالاتر یا پایین) بسیار مهم است.
- حتی هنگام تلاش برای پیش بینی اقدام قیمت جهت دار سهام ، ما این کار را در زمینه اقدام قیمت نسبت به یک معیار انجام می دهیم.
-به عنوان مثال ، یک حرکت قیمت سهام نسبت به S& P 500 (حرکت قیمت نسبی بازار). برای پیش بینی واقعاً قیمت سهام ممکن است چند روز یا چند ماه در آینده باشد ، این راه حل به احتمال زیاد باید مبتنی بر رگرسیون و قطعی باشد.
-با توجه به ماهیت پویا و غیر ثابت بازار ، این یک نظم بسیار بلند است (و به نظر من ، برای سرمایه گذاری های تأخیر بالا ، برعکس سرمایه گذاری های فرکانس بالا).
- تحقیقات ما در Lucena تقریباً به طور کامل در طبقه بندی اقدام قیمت متمرکز شده است (آیا سهام نسبت به موقعیت فعلی آن بالاتر خواهد بود). ما به طور معمول طبقه بندی کننده های یادگیری عمیق خود را با سایر روشهای قطعی یادگیری ماشین (عمدتا KNN ، درختان تصمیم گیری و غیره) پیش می بریم.
- تحقیق ما بر اساس دستیابی به بالاترین اهمیت آماری است. ما انتظار نداریم همیشه درست باشیم، بلکه بیشتر از اینکه اشتباه کنیم، درست باشیم.
- این موضوع برای شبکه های عصبی عمیق مبتنی بر TensorFlow (یک پلت فرم و چارچوب یادگیری عمیق منبع باز، توسعه یافته توسط Google Brain) و Keras و Theano (کتابخانه های مؤلفه منبع باز ساخته شده بر روی TenserFlow) خوب است.
- شبکه ها برای به حداقل رساندن تلفات (تفاوت بین نتیجه شبکه و دانش مطلوب و کامل، نتیجه برچسب دار) آموزش داده شده اند تا دقت و دقت را به حداکثر برسانند.
- برای دادههای سری زمانی، ما از ویژگیهای روزانه حمایت میکنیم که در طول زمان ثبت میشوند، اما نه لزوماً قیمتهای روزانه سهام. تحقیقات ما بینش عملی بسیار کمی از دادههای قیمت سهام خالص یا سایر ویژگیهای فنی ساده (که بر اساس اطلاعات قیمت/حجم هستند) به دست آورده است.
- شبکههای عصبی برای ارزیابی چگونگی روند ویژگیهای مختلف، که به عنوان امتیاز احساسات روزانه ثبت شدهاند، در طول زمان آموزش داده شدهاند. مهمتر از آن، شبکهها چگونگی روند چندین منبع داده متعامد را در زمانی که روی هم قرار میگیرند (به بیان تصویری) میتوانند ارتباط قانعکنندهتری با حرکت قیمت سهام نشان دهند تا ارزیابی هر ویژگی به تنهایی.
شبکه های عصبی عمیق چقدر در تجزیه و تحلیل یک منبع داده جایگزین موثر هستند؟
فرآیند استقرار دادههای جایگزین برای طبقهبندی اقدام قیمت نه تنها برای سرمایهگذارانی که به دنبال استقرار استراتژیها هستند ارزشمند است. با افزایش داده های جایگزین، ارائه دهندگان به دنبال محققین غیر مغرضانه هستند تا آمادگی داده های خود را برای استفاده در بازارهای مالی ارزیابی و تأیید کنند. در مورد چگونگی اندازه گیری تجربی داده های جایگزین در اینجا بیشتر بخوانید.
وقتی در نظر بگیرید که چه مقدار داده برای پیشبینی سهام در دسترس است، میتواند کمی نگرانکننده باشد. طرف خرید میتواند ساعتها و منابع بیشماری را صرف جمعآوری و تجزیه و تحلیل دادهها کند تا متوجه ناتوانی آن در ارتباط با نیازهای خاص خود شود.
ماموریت ما در Lucena همیشه این بوده است که شکاف بین ارائه دهندگان داده را پر کنیم و متخصصان سرمایه گذاری جانبی را خریداری کنیم. با مسائل شناخته شده داده مانند نویز، نادرستی مشاهدات و اخبار نادرست، ما مجبور شدیم فناوری طبقهبندی پیشرفتهتری ایجاد کنیم تا در سادهسازی فرآیند اعتبارسنجی دادههای جایگزین مؤثرتر باشیم.
ما به خود می بالیم که به مشتریان داده خود توصیه می کنیم که چگونه داده های خود را برای مصرف کننده مالی مؤثرتر و قانع کننده تر کنند. برای این منظور، وقتی نوبت به فرآیندمان میرسد، ما هرگز یک «جعبه سیاه» نخواهیم بود، بنابراین بدون تأخیر بیشتر، در اینجا یک مرور کلی از نحوه کمک به صرفهجویی در وقت مشتریان و منابع ارزشمند ارائه شده است.
افسانه زدایی از فرآیند اعتبارسنجی داده ها
فرآیند اعتبارسنجی یک منبع داده جایگزین را می توان در مراحل زیر خلاصه کرد:
- - دریافت داده های خام
- - از یادگیری ماشینی برای موارد زیر استفاده کنید:
- - نقشه
فرآیند تبدیل داده های خام به سیگنال های عملی:
محصول نهایی به ارائه دهندگان داده ما تحویل داده می شود و آنها می توانند به مشتریان خود ارائه دهند.
تسریع فرآیند اعتبارسنجی داده ها: DQE و DME
ما دو پلتفرم ایجاد کردهایم که فرآیند اعتبارسنجی دادهها را تسریع میکنند، موتور صلاحیت داده و موتور تطبیق داده. دو پلتفرم:
- به سرعت بلوغ اساسی یک منبع داده جایگزین را ارزیابی کنید.
- آزمون سازگاری نوع داده، پوشش جهانی، توزیع امتیاز احساسات، سوگیری بقا، NAN ها، ناهنجاری ها و نقاط پرت.
– نقشه داده – فرآیند تجمیع (معمولاً به سری های زمانی روزانه) و نگاشت امتیاز کل به اوراق بهادار قابل معامله.
- تجزیه دهک قدرت سیگنال به بازده های آتی، آزمایش های برگشتی و موارد دیگر.
- مهندس ویژگی - داده های خام را با ویژگی های مشتق شده اضافی که برای تحقیقات یادگیری ماشین مناسب تر است، تقویت کنید. به عنوان مثال: اعمال زوال زمانی، رتبه بندی نمرات در برابر جهانی از همتایان و موارد دیگر.
- طبقهبندی سیگنال رویداد برای تعیین اینکه کدام ویژگیها برای بالاترین ثبات قیمت در آینده با هم بهترین کار را دارند.
- شبیه سازی بک تست و معاملات کاغذی - در پایان فرآیندهای اعتبار سنجی و بهبود، ما برای شبیه سازی بک تست یک استراتژی معاملاتی که سهام را بر اساس سیگنال های ارائه دهنده داده خرید و فروش می کند، آماده هستیم. هر آزمون بکآزمایی را می توان به عنوان یک سبد خرید و فروش کاغذ زنده تبدیل کرد تا سیگنال های همبستگی بازده به طور دائم در آینده آزمایش شوند.
- علاوه بر این، Lucena یک تجزیه و تحلیل گزارش عملکرد و انتساب جامع برای ارزیابی بصری بسیار بصری ارائه می دهد.
شبیه سازی بک تست قدرت سیگنال در برابر یک معیار از پیش تعیین شدهBacktest سناریوی واقعی را با در نظر گرفتن هزینه تراکنش، لغزش و عدم اجازه نگاه کردن به آینده به دقت شبیه سازی می کند.
اجازه ندهید تحقیقات داده منابع شما را تخلیه کند
انفجار داده های جایگزین جدید، ابعاد جدید و هیجان انگیزی را به تحقیقات یادگیری عمیق می آورد.
داده های موقعیت مکانی ، داده های اقدام شرکت ، احساسات رسانه های اجتماعی ، فعالیت هزینه های مصرف کننده و موارد دیگر می تواند برای ارتقاء استراتژی های سرمایه گذاری شما استفاده شود.
با افزایش داده های جایگزین در بازار ، مشتری های طرف خرید به دنبال نحوه استقرار منابع تحقیقاتی خود هستند. Lucena با اجازه دادن به اتوماسیون مؤثر از ماده الکلی از سر و صدا و اجازه دادن به مدیران صندوق های تامینی ، بر روی آنچه امیدوار کننده ترین است ، این شکاف را از بین می برد.
حتی پیشرفته ترین صندوق های تامینی دائماً به دنبال راه هایی برای تعیین اینکه آیا ارائه دهنده داده ارزش پیگیری دارد یا خیر. آنها می خواهند بتوانند "سریع شکست بخورند" به طوری که تحقیقات ارزشمند در مورد داده های غیرقابل قبول هدر نمی رود. همان فناوری ما برای استقرار سیگنال های پیش بینی کننده برای استراتژی های سرمایه گذاری می توان برای ارزیابی اینکه آیا یک منبع داده جایگزین حاوی اطلاعات معتبر و پیش بینی کننده است ، استفاده شود.< Pan> داده های موقعیت مکانی ، داده های اقدام شرکت ، احساسات رسانه های اجتماعی ، فعالیت هزینه های مصرف کننده و موارد دیگر می تواند برای ارتقاء استراتژی های سرمایه گذاری شما استفاده شود.