filereader - Removing the BOM character with Java -


इस सवाल का पहले से ही एक उत्तर है: < / p>

  • 7 जवाब

    मैं फ़ाइलों को पढ़ने की कोशिश कर रहा हूँ FileReader का उपयोग करके और उन्हें एक अलग फ़ाइल में लिखें।
    ये फ़ाइलें यूटीएफ -8 एन्कोडेड हैं, लेकिन उनमें से कुछ में अभी भी एक बीओएम है।
    मैंने जिस संगत कोड की कोशिश की वह यह है:
    < पूर्व> निजी अंतिम स्ट्रिंग UTF8_BOM = "\ uFEFF"; निजी स्ट्रिंग हटानेUTF8BOM (स्ट्रिंग्स) {if (s.startsWith (UTF8_BOM)) {s = s.replace (UTF8_BOM, ""); } वापसी एस; } लाइन = हटाएटफ 8 बीओएम (लाइन);

    लेकिन किसी कारण से बीओएम को हटाया नहीं जाता है। क्या ऐसा कोई अन्य तरीका है जिसे मैं FileReader के साथ कर सकता हूं? मुझे पता है कि वहाँ BOMInputStream है कि काम करना चाहिए, लेकिन मैं बजाय FileReader का उपयोग कर एक समाधान खोजने के लिए चाहते हैं।

    क्लास फ़्लेमरीडर एक पुरानी उपयोगिता वर्ग है, जो मंच एन्कोडिंग का उपयोग करता है। विंडोज़ पर नहीं UTF-8।

    सर्वश्रेष्ठ किसी अन्य वर्ग के साथ पढ़ने के लिए।

    मनोरंजन के रूप में, और त्रुटि को स्पष्ट करने के लिए, यहां एक गंदे हैक, जो कि एकल बाइट एन्कोडिंग के साथ प्लेटफॉर्म के लिए काम करता है:

      निजी अंतिम स्ट्रिंग UTF8_BOM = नया स्ट्रिंग ("\ uFEFF" .getBytes (StandardCharsets.UTF_8));   

    यह यूटीएफ -8 बाइट हो जाता है और वर्तमान प्लेटफ़ॉर्म एन्कोडिंग में एक स्ट्रिंग बनाता है।

    यह उल्लेख करने की कोई आवश्यकता नहीं है कि FileReader गैर-पोर्टेबल है, केवल स्थानीय फाइलें।

Comments

Popular posts from this blog

mysql - where clause in inner join query -

java - Why my included JSP file won't get processed correctly? -

php - MySQL Query for Advanced Search multiple criteria -