machine learning - SVM rank works only on tiny datasets -
मैं उपयोग कर रहा हूं।
एक छोटे डाटासेट पर प्रशिक्षण सेट प्रॉपर्टी: 3 फीचर्स, 12 रैंकिंग, 596 उदाहरण रन कुछ ही सेकंड में खत्म हो जाता है और मुझे एक मान्य मॉडल मिलता है। लेकिन जब मैं कुछ का उपयोग करता हूं: प्रशिक्षण सेट गुण: 3 फीचर्स, 30 रैंकिंग, 1580 उदाहरण रन चलना पर घंटे के लिए फंस गया है 29 यह बहुत अजीब है क्योंकि दस्तावेज़ीकरण कहता है कि रैंकिंग (यानी प्रश्न) की संख्या में एसवीएम रैंक "रैखिक स्तर"। मेरे डेटासेट या प्रारूप में क्या गलत है? हालांकि, चूंकि मैं कोडन SVMrank पर एक दोपहर से अधिक समय बिताना नहीं चाहता था, मैंने केवल एक साधारण पृथक्करण ओरेकल लागू किया है प्रत्येक रैंकिंग में मदों की संख्या में द्विघात [जोकिम्स, 2006] में वर्णित ओ [के * लॉग के] अलग ऑरेकल नहीं है। आप 3 से अधिक उदाहरणों की संख्या में अधिक या कम वृद्धि कर रहे हैं। इसलिए, आप अपेक्षा करते हैं कि समय 9 के कारक से बढ़ता है। [एस] प्रलेखन में कहा गया है कि रैंकिंग की संख्या में एसवीएम रैंक "तराजू रैखिक (यानी प्रश्न)" आप रैंकिंग की संख्या को भी थोड़ी अधिक के एक पहलू से भी स्केल कर सकते हैं 2. तो, इस दोनों को गठबंधन करें, और आप अपेक्षा करते हैं कि प्रशिक्षण लगभग 20 गुना तक ले जाएगा। यह स्पष्ट नहीं करता कि यह कुछ सेकंड से कई घंटों तक क्यों जाता है। svm_rank_learn चलते समय:
Comments
Post a Comment