Sunday 30 July 2017

อัต เฉลี่ยเคลื่อนที่ แบบ ละเอียด


ค่าเฉลี่ยเคลื่อนที่แบบอัตถดถอย - ARIMA DEFINITION ของค่าเฉลี่ยเคลื่อนที่แบบอัตโนมัติแบบอัตถดถอย - ARIMA แบบจำลองการวิเคราะห์ทางสถิติที่ใช้ข้อมูลชุดเวลาเพื่อคาดการณ์แนวโน้มในอนาคต เป็นรูปแบบหนึ่งของการวิเคราะห์การถดถอยที่พยายามจะคาดการณ์การเคลื่อนไหวในอนาคตตามการเดินแบบสุ่มที่ดูเหมือนโดยหุ้นและตลาดการเงินโดยการตรวจสอบความแตกต่างระหว่างค่าในชุดแทนที่จะใช้ค่าข้อมูลจริง ความล่าช้าของซีรี่ส์ที่แตกต่างกันจะเรียกว่าการล่วงประเวณีและการล่าช้าภายในข้อมูลที่คาดการณ์จะเรียกว่าค่าเฉลี่ยเคลื่อนที่ การลดลงของค่าเฉลี่ยแบบรวมอัตโนมัติ - ARIMA ประเภทของโมเดลนี้โดยทั่วไปจะเรียกว่า ARIMA (p, d, q) โดยมีจำนวนเต็มหมายถึงอัตรอัตโนม รวมและส่วนค่าเฉลี่ยเคลื่อนที่ของชุดข้อมูลตามลำดับ การสร้างแบบจำลอง ARIMA สามารถพิจารณาแนวโน้มตามฤดูกาลได้ รอบข้อผิดพลาดและด้านที่ไม่เป็นนิ่งของชุดข้อมูลเมื่อทำการคาดการณ์ RIMA ย่อมาจากโมเดลเฉลี่ยเคลื่อนที่เชิงรุกแบบอัตโนมัติ (single vector) ARIMA เป็นเทคนิคการพยากรณ์ที่คาดการณ์มูลค่าในอนาคตของชุดข้อมูลโดยอิงกับความเฉื่อยของตัวเอง การประยุกต์ใช้หลักของมันอยู่ในพื้นที่ของการคาดการณ์ในระยะสั้นที่ต้องใช้จุดข้อมูลทางประวัติศาสตร์อย่างน้อย 40 จุด ทำงานได้ดีที่สุดเมื่อข้อมูลของคุณมีรูปแบบที่มั่นคงหรือสอดคล้องกันตลอดเวลาโดยมีจำนวนข้อผิดพลาดน้อยที่สุด บางครั้งเรียกว่า Box-Jenkins (หลังจากผู้เขียนต้นฉบับ) ARIMA มักจะดีกว่าเทคนิคการทำให้เกิดการชี้แจงเมื่อข้อมูลมีความยาวและความสัมพันธ์ระหว่างการสังเกตในอดีตมีเสถียรภาพ หากข้อมูลสั้นหรือมีความผันผวนสูงวิธีการปรับความเรียบบางวิธีอาจทำงานได้ดีขึ้น หากคุณไม่มีจุดข้อมูลอย่างน้อย 38 จุดคุณควรพิจารณาวิธีการอื่นนอกเหนือจาก ARIMA ขั้นตอนแรกในการใช้วิธีการ ARIMA คือการตรวจสอบ stationarity Stationarity แสดงให้เห็นว่าซีรีย์ยังคงอยู่ในระดับที่คงที่ตลอดเวลา หากมีแนวโน้มเช่นเดียวกับในแอปพลิเคชันทางเศรษฐกิจหรือธุรกิจส่วนใหญ่ข้อมูลของคุณจะยังคงอยู่ไม่หยุดนิ่ง ข้อมูลควรแสดงความแปรปรวนของความผันผวนตลอดเวลา นี่ดูได้อย่างง่ายดายด้วยชุดที่มีฤดูกาลมากและเติบโตขึ้นในอัตราที่รวดเร็วขึ้น ในกรณีเช่นนี้การขึ้นและการดาวน์ในฤดูกาลจะทวีความรุนแรงมากขึ้นเมื่อเวลาผ่านไป หากไม่พบเงื่อนไขการหยุดนิ่งเหล่านี้จะไม่สามารถคำนวณการคำนวณจำนวนมากที่เกี่ยวข้องกับกระบวนการนี้ได้ หากพล็อตข้อมูลแบบกราฟิกแสดงถึงความไม่เสถียรภาพคุณควรแตกต่างจากชุดข้อมูล Differencing เป็นวิธีที่ยอดเยี่ยมในการเปลี่ยนชุดแบบไม่ต่อเนื่องให้เป็นแบบคงที่ โดยการลบคำสังเกตในช่วงเวลาปัจจุบันออกจากข้อสังเกตก่อนหน้านี้ หากการแปลงนี้ทำเพียงครั้งเดียวกับชุดคุณจะกล่าวว่าข้อมูลนี้มีความแตกต่างกันเป็นครั้งแรก ขั้นตอนนี้เป็นหลักช่วยลดแนวโน้มหากชุดของคุณมีอัตราการเติบโตที่ค่อนข้างคงที่ หากอัตราการเติบโตเพิ่มขึ้นคุณสามารถใช้ขั้นตอนเดียวกันและทำให้ข้อมูลแตกต่างกันได้อีก จากนั้นข้อมูลของคุณจะแตกต่างกันไป Autocorrelations เป็นค่าตัวเลขที่ระบุว่าชุดข้อมูลเกี่ยวข้องกับตัวเองอย่างไรเมื่อเวลาผ่านไป อย่างแม่นยำมากขึ้นจะวัดว่าค่าข้อมูลอย่างมากที่ช่วงระยะเวลาที่ระบุเป็นจำนวนเท่าใดมีความสัมพันธ์กันเมื่อเวลาผ่านไป จำนวนรอบระยะเวลาโดยปกติจะเรียกว่าความล่าช้า ตัวอย่างเช่นค่าความสัมพันธ์ระหว่างความคลาดเคลื่อน 1 วัดค่าที่แตกต่างกันของช่วงเวลา 1 ช่วงเวลาที่มีความสัมพันธ์กันในชุดข้อมูล ความสัมพันธ์กันที่ความล่าช้า 2 วัดว่าข้อมูลสองช่วงเวลามีความสัมพันธ์กันอย่างไรในซีรี่ส์ Autocorrelations อาจอยู่ในช่วงตั้งแต่ 1 ถึง -1 ค่าใกล้เคียงกับ 1 แสดงถึงความสัมพันธ์ทางบวกที่สูงในขณะที่ค่าใกล้เคียงกับ -1 แสดงถึงความสัมพันธ์เชิงลบสูง มาตรการเหล่านี้มักได้รับการประเมินผ่านทางกราฟฟิกที่เรียกว่า correlagrams correlagram แปลงค่าความสัมพันธ์แบบอัตโนมัติสำหรับชุดข้อมูลหนึ่ง ๆ ที่มีความล่าช้าแตกต่างกัน นี่เรียกว่าฟังก์ชัน autocorrelation และมีความสำคัญมากในวิธีการ ARIMA วิธีการ ARIMA พยายามที่จะอธิบายการเคลื่อนไหวในชุดเวลาแบบคงที่ในฐานะที่เป็นหน้าที่ของสิ่งที่เรียกว่าพารามิเตอร์อัตถิภาวนิยมและค่าเฉลี่ยเคลื่อนที่ พารามิเตอร์เหล่านี้เรียกว่าพารามิเตอร์ AR (autoregessive) และพารามิเตอร์ MA (ค่าเฉลี่ยเคลื่อนที่) อาจมีการเขียนแบบ AR ที่มีเพียง 1 พารามิเตอร์เท่านั้น X (t) A (1) X (t-1) E (t) โดยที่ X (t) เวลาชุดภายใต้การตรวจสอบ A (1) พารามิเตอร์ autoregressive ของลำดับ 1 X (t-1) ชุดเวลาล้าหลัง 1 ระยะเวลา E (t) ความผิดพลาดของรูปแบบนี้ก็หมายความว่าค่าใดก็ตาม X (t) สามารถอธิบายได้จากฟังก์ชันของค่าก่อนหน้าที่ X (t-1) รวมทั้งข้อผิดพลาดแบบสุ่มบางส่วนที่ไม่สามารถอธิบายได้ E (t) ถ้าค่าประมาณของ A (1) เท่ากับ. 30 มูลค่าปัจจุบันของชุดจะสัมพันธ์กับ 30 ค่าก่อนหน้า 1 แน่นอนว่าซีรีย์นี้อาจเกี่ยวข้องกับมากกว่าหนึ่งค่าที่ผ่านมา ตัวอย่างเช่น X (t) A (1) X (t-1) A (2) X (t-2) E (t) นี่แสดงว่าค่าปัจจุบันของชุดคือการรวมกันของสองค่าก่อนหน้านี้ทันที, X (t-1) และ X (t-2) รวมทั้งข้อผิดพลาดแบบสุ่ม E (t) แบบจำลองของเราตอนนี้เป็นโมเดลอัตรกรรรณ์ของคำสั่ง 2 การเคลื่อนที่แบบเฉลี่ย: แบบที่สองของแบบจำลอง Box-Jenkins เรียกว่าแบบจำลองค่าเฉลี่ยเคลื่อนที่ แม้ว่ารูปแบบเหล่านี้มีลักษณะคล้ายกับรุ่น AR แต่แนวคิดที่อยู่เบื้องหลังพวกเขามีความแตกต่างกันออกไป การย้ายค่าเฉลี่ยจะสัมพันธ์กับสิ่งที่เกิดขึ้นในช่วง t เฉพาะกับข้อผิดพลาดแบบสุ่มที่เกิดขึ้นในช่วงเวลาที่ผ่านมาเช่น E (t-1), E (t-2) เป็นต้นแทนที่จะเป็น X (t-1), X ( t-2), (Xt-3) ตามแนวทาง autoregressive แบบเฉลี่ยถ่วงน้ำหนักโดยเฉลี่ยที่มีระยะ MA สามารถเขียนได้ดังนี้ X (t) - B (1) E (t-1) E (t) คําวา B (1) เรียกวา MA ของคําสั่ง 1. เครื่องหมายลบที่ดานหนาของพารามิเตอรใชสําหรับการประชุมเทานั้น ออกโดยอัตโนมัติโดยโปรแกรมคอมพิวเตอร์ส่วนใหญ่ แบบจำลองข้างต้นกล่าวง่ายๆว่าค่าที่กำหนดของ X (t) มีความสัมพันธ์โดยตรงกับความผิดพลาดแบบสุ่มในช่วงก่อนหน้า, E (t-1) และระยะเวลาข้อผิดพลาดปัจจุบัน E (t) เช่นเดียวกับในกรณีของโมเดลอัตถิภาวนิยมโมเดลค่าเฉลี่ยเคลื่อนที่สามารถขยายไปยังโครงสร้างคำสั่งซื้อที่สูงขึ้นซึ่งครอบคลุมชุดค่าผสมต่างๆและความยาวเฉลี่ยที่เคลื่อนที่ได้ วิธีการ ARIMA ยังช่วยให้สามารถสร้างโมเดลที่มีทั้งค่าเฉลี่ยอัตรวจและเคลื่อนไหวโดยรวมเข้าด้วยกัน โมเดลเหล่านี้มักเรียกว่าแบบผสม แม้ว่าสิ่งนี้จะทำให้เครื่องมือคาดการณ์ที่ซับซ้อนมากขึ้น แต่โครงสร้างอาจจำลองชุดข้อมูลได้ดีขึ้นและสร้างการคาดการณ์ที่แม่นยำขึ้น โมเดล Pure หมายความว่าโครงสร้างประกอบด้วยเฉพาะ AR หรือพารามิเตอร์ MA - ไม่ใช่ทั้งสองอย่าง โมเดลที่พัฒนาโดยวิธีนี้มักเรียกว่า ARIMA เนื่องจากใช้การผสมผสานของอัตมโนทัศน์ (AR), การผสมผสาน (I) - หมายถึงกระบวนการย้อนกลับของ differencing เพื่อสร้างการคาดการณ์และการดำเนินงานโดยเฉลี่ย (MA) แบบ ARIMA มักถูกระบุว่าเป็น ARIMA (p, d, q) นี่แสดงลำดับของคอมโพเนนต์ autoregressive (p) จำนวน operator ที่ต่างกัน (d) และคำสั่งที่สูงที่สุดของค่าเฉลี่ยเคลื่อนที่ ยกตัวอย่างเช่น ARIMA (2,1,1) หมายความว่าคุณมีแบบจำลองอัตถดถอยอันดับที่สองที่มีส่วนประกอบของค่าเฉลี่ยเคลื่อนที่อันดับแรกที่มีการจัดลำดับชุดหนึ่งครั้งเพื่อกระตุ้นให้เกิดการหยุดนิ่ง การเลือกข้อมูลจำเพาะที่ถูกต้อง: ปัญหาหลักในคลาสสิก Box-Jenkins กำลังพยายามตัดสินใจว่าจะใช้ ARIA ข้อกำหนดใดบ้างเพื่อใช้ - i. e. จำนวนอาร์เรย์และพารามิเตอร์ MA ที่รวมไว้ นี่คือสิ่งที่มากของ Box-Jenkings 1976 ได้ทุ่มเทให้กับกระบวนการระบุตัวตน ขึ้นอยู่กับการประเมินผลแบบกราฟิกและตัวเลขของการเชื่อมโยงความสัมพันธ์ระหว่างตัวอย่างและฟังก์ชันการเชื่อมโยงบางส่วน (autocorrelation) ดีสำหรับรุ่นพื้นฐานของคุณงานไม่ยากเกินไป แต่ละฟังก์ชันมีความสัมพันธ์กันโดยอัตโนมัติซึ่งมีลักษณะบางอย่าง อย่างไรก็ตามเมื่อคุณขึ้นไปอย่างซับซ้อนรูปแบบจะไม่สามารถตรวจพบได้ง่าย เพื่อให้เรื่องยากขึ้นข้อมูลของคุณเป็นเพียงตัวอย่างของกระบวนการอ้างอิงเท่านั้น ซึ่งหมายความว่าข้อผิดพลาดในการสุ่มตัวอย่าง (ข้อผิดพลาดค่าผิดพลาดในการวัด ฯลฯ ) อาจบิดเบือนกระบวนการระบุตัวตนทางทฤษฎี นั่นคือเหตุผลที่การสร้างแบบจำลอง ARIMA แบบดั้งเดิมเป็นศิลปะมากกว่าวิทยาศาสตร์การเคลื่อนที่เฉลี่ย ARMA เฉลี่ย (p, q) โมเดลสำหรับการวิเคราะห์อนุกรมเวลา - ตอนที่ 3 นี่เป็นโพสต์ที่สามและครั้งสุดท้ายในมินิซีรีส์เกี่ยวกับค่าเฉลี่ยเคลื่อนที่แบบอัตโนรารี (ARMA) แบบจำลองการวิเคราะห์อนุกรมเวลา เราได้นำเสนอโมเดล Autoregressive และ Moving Average model ในบทความก่อนหน้านี้สองบทความ ตอนนี้ถึงเวลาที่จะรวมเอาไว้เพื่อสร้างแบบจำลองที่ซับซ้อนมากขึ้น สุดท้ายนี้จะนำเราไปสู่รูปแบบ ARIMA และ GARCH ที่จะช่วยให้เราสามารถคาดการณ์ผลตอบแทนของสินทรัพย์และความผันผวนของการคาดการณ์ได้ แบบจำลองเหล่านี้จะเป็นพื้นฐานสำหรับสัญญาณการซื้อขายและเทคนิคการบริหารความเสี่ยง หากอ่านส่วนที่ 1 และส่วนที่ 2 คุณจะเห็นว่าเรามีแนวโน้มที่จะทำตามรูปแบบสำหรับการวิเคราะห์แบบจำลองชุดเวลา ฉันจะทำซ้ำในเวลาสั้น ๆ ที่นี่: เหตุผล - ทำไมเราสนใจในรูปแบบเฉพาะนี้ - นิยามทางคณิตศาสตร์เพื่อลดความคลุมเครือ Correlogram - การจัดทำตัวอย่าง correlogram เพื่อดูพฤติกรรมแบบจำลอง การจำลองและการติดตั้ง - ใส่แบบจำลองเพื่อจำลองเพื่อให้มั่นใจได้ว่ารูปแบบถูกต้อง ข้อมูลทางการเงินที่แท้จริง - ใช้รูปแบบกับราคาสินทรัพย์ในอดีตที่แท้จริง การคาดการณ์ - คาดการณ์มูลค่าที่ตามมาในการสร้างสัญญาณการซื้อขายหรือตัวกรอง เพื่อที่จะทำตามบทความนี้ขอแนะนำให้ดูบทความก่อนหน้านี้เกี่ยวกับการวิเคราะห์อนุกรมเวลา พวกเขาทั้งหมดสามารถพบได้ที่นี่ หลักเกณฑ์ของ Bayesian Information ในส่วนที่ 1 ของบทความนี้เราได้พิจารณา Akaike Information Criterion (AICACA Information Criterion (AICACA Criterion Information) เพื่อช่วยในการเลือกรูปแบบของซีรีส์เวลาที่ดีที่สุด เครื่องมือที่เกี่ยวข้องอย่างใกล้ชิดคือหลักเกณฑ์ข้อมูลเบส์ (Bayesian Information Criterion - BIC) โดยทั่วไปแล้วจะมีลักษณะคล้ายคลึงกับ AIC เนื่องจากเป็นการลงโทษโมเดลที่มีพารามิเตอร์มากเกินไป นี้อาจนำไปสู่การ overfitting ความแตกต่างระหว่าง BIC และ AIC คือ BIC เข้มงวดมากขึ้นเมื่อมีการลงโทษพารามิเตอร์เพิ่มเติม ข้อมูล Bayesian Information Criterion ถ้าเราใช้ฟังก์ชันความน่าจะเป็นสำหรับแบบจำลองทางสถิติซึ่งมีพารามิเตอร์ k และ L จะเพิ่มโอกาสให้มากที่สุด แล้วเกณฑ์ข้อมูลเบย์ได้รับโดย: โดยที่ n คือจำนวนจุดข้อมูลในชุดข้อมูลเวลา เราจะใช้ AIC และ BIC ด้านล่างเมื่อเลือกโมเดล ARMA (p, q) ที่เหมาะสม การทดสอบ Ljung-Box ในตอนที่ 1 ของบทความชุดนี้ Rajan กล่าวในข้อคิดเห็น Disqus ว่าการทดสอบ Ljung-Box มีความเหมาะสมกว่าการใช้ Akaike Information Criterion ของ Bayesian Information Criterion ในการตัดสินใจว่ารูปแบบ ARMA เหมาะสมหรือไม่กับเวลา ชุด. การทดสอบ Ljung-Box เป็นการทดสอบสมมุติฐานแบบคลาสสิกที่ออกแบบมาเพื่อทดสอบว่าชุดของความสัมพันธ์แบบอัตโนมัติของชุดเวลาแบบติดตั้งมีความแตกต่างจากศูนย์อย่างมากหรือไม่ การทดสอบไม่ได้ทดสอบแต่ละความล่าช้าสำหรับ randomness แต่ทดสอบการสุ่มมากกว่ากลุ่มล่าช้า การทดสอบ Ljung-Box เรากำหนดสมมติฐานที่เป็นโมฆะดังนี้: ข้อมูลชุดข้อมูลเวลาที่แต่ละความล่าช้าคือ i. i.d .. นั่นคือความสัมพันธ์ระหว่างค่าชุดประชากรเป็นศูนย์ เรากำหนดสมมติฐานสำรองเป็น: ข้อมูลชุดข้อมูลเวลาไม่ใช่ i. i.d. และมีความสัมพันธ์แบบอนุกรม เราคำนวณสถิติการทดสอบต่อไปนี้ Q: ในกรณีที่ n คือความยาวของชุดตัวอย่างเวลา hat คือ k Autocorrelation ตัวอย่างที่ lag k และ h คือจำนวนความล่าช้าที่อยู่ภายใต้การทดสอบ กฎการตัดสินใจว่าจะปฏิเสธสมมติฐานที่เป็นโมฆะคือการตรวจสอบว่า Q gt chi2 สำหรับการกระจายแบบไคสแควร์กับองศาเอชองศาอิสระที่ 100 (1-alpha) th percentile แม้ว่ารายละเอียดของการทดสอบอาจดูเหมือนซับซ้อนเล็กน้อย แต่ในความเป็นจริงเราสามารถใช้ R เพื่อคำนวณการทดสอบสำหรับเราทำให้ขั้นตอนง่ายขึ้น ค่าเฉลี่ยการเคลื่อนที่แบบอัตถิภาวนิยม (ARMA) รูปแบบของ p p, q ขณะนี้เราได้กล่าวถึง BIC และการทดสอบ Ljung-Box แล้วเราพร้อมที่จะหารือเกี่ยวกับรูปแบบผสมผสานครั้งแรกของเราคือค่าเฉลี่ยการเคลื่อนที่โดยอัตโนมัติของลำดับ p, q หรือ ARMA (p, Q) จนถึงปัจจุบันเราได้พิจารณากระบวนการอัตโนมัติและย้ายกระบวนการเฉลี่ย แบบเดิมพิจารณาพฤติกรรมในอดีตของตัวเองเป็นปัจจัยการผลิตสำหรับรูปแบบและเป็นความพยายามดังกล่าวในการจับภาพผลกระทบของผู้มีส่วนร่วมในตลาดเช่นโมเมนตัมและการพลิกกลับในการซื้อขายหุ้น รูปแบบหลังใช้เพื่ออธิบายลักษณะของข้อมูลที่ตกใจเป็นชุดเช่นการประกาศรายได้ที่น่าประหลาดใจหรือเหตุการณ์ที่ไม่คาดคิด (เช่นการรั่วไหลของน้ำมัน BP Deepwater Horizon) ดังนั้นรูปแบบ ARMA จึงพยายามจับภาพทั้งสองด้านเมื่อสร้างแบบจำลองทางการเงิน โปรดทราบว่าแบบจำลอง ARMA ไม่ได้คำนึงถึงการจัดกลุ่มความผันผวนของบัญชีซึ่งเป็นปรากฏการณ์เชิงประจักษ์ที่สำคัญของชุดเวลาทางการเงินจำนวนมาก ไม่ใช่แบบจำลองเชิงตรรกะที่มีเงื่อนไข สำหรับการที่เราจะต้องรอให้รุ่น ARCH และ GARCH นิยามรูปแบบ ARMA (p, q) คือการรวมกันเชิงเส้นของแบบจำลองเชิงเส้นทั้งสองแบบและด้วยเหตุนี้เองก็ยังคงเป็นแบบเชิงเส้น: แบบจําลองเฉลี่ยเคลื่อนที่แบบอัตถดถอยของลำดับ p, q แบบจําลองแบบเวลา, คือแบบจําลองเฉลี่ยเคลื่อนที่แบบอัตโนรารีของลำดับ p, q . ARMA (p, q) ถ้า: เริ่ม xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end เสียงรบกวนสีขาวคือ E (wt) 0 และ sigma2 แปรปรวน ถ้าเราพิจารณา Backward Shift Operator (ดูบทความก่อนหน้า) แล้วเราสามารถเขียนข้างต้นเป็นฟังก์ชัน theta และ phi ของ: เราสามารถตรงไปตรงมาเห็นว่าโดยการตั้งค่า p neq 0 และ q0 เรากู้คืนรูปแบบ AR (p) ในทำนองเดียวกันถ้าเรากำหนด p 0 และ q neq 0 เราจะกู้คืนรูปแบบ MA (q) หนึ่งในคุณสมบัติที่สำคัญของรูปแบบ ARMA คือว่ามันเป็นเรื่องที่ซับซ้อนและซ้ำซ้อนในพารามิเตอร์ของ นั่นคือรูปแบบ ARMA มักจะต้องใช้พารามิเตอร์น้อยกว่าแบบ AR (p) หรือ MA (q) เพียงอย่างเดียว นอกจากนี้ถ้าเราเขียนสมการในแง่ของ BSO ​​แล้วคำพหุนาม theta และ phi บางครั้งอาจมีส่วนร่วมกันซึ่งจะนำไปสู่รูปแบบที่เรียบง่าย เช่นเดียวกับแบบจำลองอัตถดถอยและค่าเฉลี่ยเคลื่อนที่เราจะจำลองชุด ARMA ต่างๆและพยายามปรับรูปแบบ ARMA ให้ตรงกับความต้องการเหล่านี้ เราดำเนินการนี้เนื่องจากเราต้องการให้แน่ใจว่าเราเข้าใจขั้นตอนการติดตั้งรวมทั้งวิธีการคำนวณระยะเวลาความเชื่อมั่นสำหรับโมเดลรวมทั้งตรวจสอบให้แน่ใจว่าขั้นตอนนี้สามารถกู้คืนค่าประมาณที่สมเหตุสมผลสำหรับพารามิเตอร์ ARMA เดิมได้ ในส่วนที่ 1 และส่วนที่ 2 เราได้สร้างชุด AR และ MA ด้วยตนเองโดยการวาดตัวอย่าง N จากการแจกแจงแบบปกติและสร้างชุดรูปแบบเวลาที่กำหนดโดยใช้ความล่าช้าของตัวอย่างเหล่านี้ อย่างไรก็ตามมีวิธีที่ง่ายกว่าในการจำลองข้อมูล AR, MA, ARMA และแม้แต่ ARIMA เพียงแค่ใช้วิธี arima. sim ใน R. ให้เริ่มต้นด้วยรูปแบบ ARMA ที่ไม่ใช่ตัวเลขที่ง่ายที่สุด ได้แก่ ARMA (1,1 ) แบบจำลอง นั่นคือแบบจำลองอัตถดถอยของคำสั่งหนึ่งบวกกับรูปแบบค่าเฉลี่ยเคลื่อนที่ของคำสั่งหนึ่ง รุ่นดังกล่าวมีค่าสัมประสิทธิ์แอลฟาและเบต้าเพียงสองค่าเท่านั้นซึ่งเป็นตัวแสดงความล่าช้าครั้งแรกของชุดข้อมูลเวลาและเงื่อนไขการรบกวนด้วยเสียงสีขาว แบบจำลองดังกล่าวได้จาก: เราต้องระบุค่าสัมประสิทธิ์ก่อนการจำลอง อนุญาตให้ใช้ alpha 0.5 และ beta -0.5 ผลลัพธ์ที่ได้จะเป็นดังนี้: ช่วยให้เราทราบถึง correlogram: เราจะเห็นว่าไม่มีนัยสำคัญที่จะเกิดขึ้นได้จากแบบจำลอง ARMA (1,1) ลองคำนวณค่าสัมประสิทธิ์และข้อผิดพลาดมาตรฐานโดยใช้ฟังก์ชัน arima: เราสามารถคำนวณช่วงความเชื่อมั่นสำหรับแต่ละพารามิเตอร์โดยใช้ข้อผิดพลาดมาตรฐานช่วงความเชื่อมั่นจะมีค่าพารามิเตอร์ที่แท้จริงสำหรับทั้งสองกรณี แต่เราควรทราบว่า ช่วงความเชื่อมั่น 95 มีความกว้างมาก (เป็นผลมาจากข้อผิดพลาดมาตรฐานที่มีขนาดใหญ่พอสมควร) ลองใช้โมเดล ARMA (2,2) แล้ว นั่นคือโมเดล AR (2) รวมกับรูปแบบ MA (2) เราต้องระบุพารามิเตอร์สี่แบบสำหรับรุ่นนี้ ได้แก่ alpha1, alpha2, beta1 และ beta2 ให้ alpha1 0.5, alpha2-0.25 beta10.5 และ beta2-0.3: ผลลัพธ์ของโมเดล ARMA (2,2) ของเรามีดังนี้: และการปรับเทียบอัตโนมัติที่สอดคล้องกัน: ตอนนี้เราสามารถลองใช้โมเดล ARMA (2,2) ข้อมูล: เราสามารถคำนวณช่วงความเชื่อมั่นสำหรับแต่ละพารามิเตอร์ด้วยเช่นกันโปรดสังเกตว่าช่วงความเชื่อมั่นสำหรับค่าสัมประสิทธิ์สำหรับองค์ประกอบเฉลี่ยเคลื่อนที่ (เบต้าและเบต้า 2) ไม่มีค่าพารามิเตอร์เดิม แม้จะทราบค่าพารามิเตอร์ที่แท้จริง แต่เพื่อการค้าเราจำเป็นต้องมีอำนาจในการคาดการณ์ที่มากกว่าโอกาสและก่อให้เกิดผลกำไรสูงกว่าค่าใช้จ่ายในการทำธุรกรรมเพื่อที่จะทำกำไรได้ ระยะยาว ตอนนี้เราเห็นตัวอย่างโมเดล ARMA จำลองแล้วเราจำเป็นต้องมีกลไกในการเลือกค่าของ p และ q เมื่อเหมาะสมกับรูปแบบข้อมูลทางการเงินที่แท้จริง การเลือกแบบ ARMA (p, q) ที่ดีที่สุดเพื่อที่จะกำหนดลำดับ p, q ของรูปแบบ ARMA นั้นเหมาะสมกับชุดข้อมูลเราจำเป็นต้องใช้ AIC (หรือ BIC) ในเซตย่อยของค่าสำหรับ p, q และ จากนั้นใช้การทดสอบ Ljung-Box เพื่อตรวจสอบว่ามีความเหมาะสมหรือไม่สำหรับค่าเฉพาะของ p, q เพื่อแสดงวิธีนี้เราจะต้องจำลองกระบวนการ ARMA (p, q) โดยเฉพาะ จากนั้นเราจะวนค่า pairwise ทั้งหมดของ p in และ q in และคำนวณค่า AIC เราจะเลือกรุ่นที่มี AIC ต่ำสุดและเรียกใช้การทดสอบ Ljung-Box สำหรับส่วนที่เหลือเพื่อตรวจสอบว่าเราได้รับความพอดีหรือไม่ ให้เริ่มต้นด้วยการจำลองชุด ARMA (3,2): ขณะนี้เราจะสร้างวัตถุสุดท้ายเพื่อจัดเก็บแบบจำลองที่ดีที่สุดและค่า AIC ต่ำสุด เราวนรอบชุดค่าผสมต่างๆ p, q และใช้อ็อบเจ็กต์ปัจจุบันเพื่อเก็บรูปแบบของ ARMA (i, j) สำหรับตัวแปรวนรอบ i และ j ถ้า AIC ปัจจุบันมีค่าน้อยกว่า AIC ที่คำนวณไว้ก่อนหน้านี้เราจะกำหนด AIC สุดท้ายให้เป็นค่าปัจจุบันนี้และเลือกลำดับดังกล่าว เมื่อมีการสิ้นสุดของลูปเรามีคำสั่งของแบบจำลอง ARMA ที่จัดเก็บไว้ใน final. order และ ARIMA (p, d, q) พอดีตัวเอง (ด้วยส่วนประกอบ Integrated d ที่ตั้งเป็น 0) ที่เก็บไว้เป็น final. arma: ให้เอาต์พุต AIC , ลำดับและค่าสัมประสิทธิ์ของ ARIMA: เราจะเห็นว่ามีการกู้คืนคำสั่งเดิมของโมเดล ARMA จำลองนั่นคือด้วย p3 และ q2 เราสามารถวางแผน corelogram ของส่วนที่เหลือของโมเดลเพื่อดูว่ารูปลักษณ์เหล่านี้มีลักษณะเหมือนการรับสัญญาณเสียงสีขาวแบบแยก (DWN): corelogram มีลักษณะเหมือน DWN จริงหรือไม่ สุดท้ายเราทำการทดสอบ Ljung-Box 20 lags เพื่อยืนยันสิ่งนี้: สังเกตว่าค่า p สูงกว่า 0.05 ซึ่งระบุว่าส่วนที่เหลือเป็นอิสระที่ระดับ 95 และแบบจำลอง ARMA (3,2) ให้ พอดีกับรูปแบบที่ดี เห็นได้ชัดว่านี่เป็นกรณีที่เราต้องจำลองข้อมูลเองอย่างไรก็ตามนี่คือขั้นตอนที่เราจะใช้แบบจำลอง ARMA (p, q) กับดัชนี SampP500 ในส่วนต่อไปนี้ ข้อมูลทางการเงินตอนนี้เราได้ระบุขั้นตอนในการเลือกแบบจำลองของซีรีส์เวลาที่เหมาะสมสำหรับซีพียูแบบจำลองแล้วมันค่อนข้างตรงไปตรงมาที่จะนำไปใช้กับข้อมูลทางการเงิน สำหรับตัวอย่างนี้เราจะเลือก SampP500 US Equity Index อีกครั้ง อนุญาตให้ดาวน์โหลดราคาปิดรายวันโดยใช้ quantmod แล้วสร้างกระแสการรับส่งข้อมูลเข้าสู่ระบบ: ช่วยให้สามารถดำเนินการตามขั้นตอนเดียวกับแบบจำลอง ARMA (3,2) ข้างต้นในชุดบันทึกการส่งกลับของ SampP500 โดยใช้ AIC: แบบจำลองที่เหมาะสมที่สุด มีคำสั่ง ARMA (3,3): ช่วยให้เศษของรูปแบบที่พอดีกับกระแสการรับส่งข้อมูลรายวันของ SampP500: โปรดสังเกตว่ามียอดที่มีนัยสำคัญบางอย่างโดยเฉพาะอย่างยิ่งที่ความล่าช้าที่สูงขึ้น นี่แสดงให้เห็นถึงความพอดีที่ไม่ดี ให้ทำการทดสอบ Ljung-Box เพื่อดูว่าเรามีหลักฐานทางสถิติหรือไม่: ตามที่เราคาดไว้ค่า p-value มีค่าน้อยกว่า 0.05 และเราไม่สามารถบอกได้ว่าเศษส่วนที่เหลือเป็นสัญญาณรบกวนสีขาวแบบแยกส่วน ดังนั้นจึงมีความสัมพันธ์กันในส่วนที่เหลือซึ่งไม่ได้อธิบายโดยรูปแบบ ARMA (3,3) ที่ติดตั้งไว้ ขั้นตอนถัดไปตามที่ได้อธิบายไว้ในบทความนี้เราได้เห็นหลักฐานเกี่ยวกับความคลาดเคลื่อนทางความยืดหยุ่น (volatility clustering) ในชุด SampP500 โดยเฉพาะอย่างยิ่งในช่วงเวลาประมาณปีพ. ศ. 2550-2551 เมื่อเราใช้โมเดล GARCH ในบทความต่อไปเราจะดูวิธีกำจัดความสัมพันธ์ระหว่างกันนี้ ในทางปฏิบัติแบบจำลอง ARMA มักไม่ค่อยเหมาะสำหรับการรับผลตอบแทนของหุ้นในตลาดหลักทรัพย์ เราจำเป็นต้องคำนึงถึงความยืดหยุ่นในรูปแบบที่มีเงื่อนไขและใช้การรวมกันของ ARIMA และ GARCH บทความถัดไปจะพิจารณา ARIMA และแสดงให้เห็นว่าส่วนประกอบแบบบูรณาการแตกต่างจากรูปแบบ ARMA ที่เราได้รับการพิจารณาในบทความนี้ เพิ่งเริ่มต้นกับการซื้อขายเชิงปริมาณ

No comments:

Post a Comment