मुफ़्त टेक्स्ट से CSV कनवर्टर

तालिका टेक्स्ट डेटा को CSV फ़ॉर्मेट में कनवर्ट करें। सेपरेटर, उद्धरण प्रबंधन और डाउनलोड से पहले पूर्वावलोकन की स्वचालित पहचान।

आपका डेटा कभी आपके डिवाइस से नहीं जाता

CSV प्रारूप के बारे में

CSV (Comma-Separated Values) सारणीबद्ध डेटा संग्रहीत करने के लिए एक सरल टेक्स्ट प्रारूप है। प्रत्येक पंक्ति एक पंक्ति है।

CSV में क्यों रूपांतरित करें?

अक्सर पूछे जाने वाले प्रश्न

टूल कौन से विभाजक का समर्थन करता है?

यह स्वचालित रूप से टैब, स्पेस, कॉमा, सेमीकोलन और पाइप का पता लगाता है। आप कस्टम विभाजक भी सेट कर सकते हैं।

कॉमा वाले फ़ील्ड को कैसे संभालें?

कॉमा वाले फ़ील्ड को उद्धरण में रखने के लिए "कॉमा वाले फ़ील्ड को उद्धरण में रखें" विकल्प सक्षम करें, जो CSV मानक के अनुरूप है।

क्या मैं हेडर शामिल कर सकता हूँ?

हाँ, यदि आपकी पहली पंक्ति में कॉलम नाम हैं तो "हेडर पंक्ति शामिल करें" विकल्प सक्षम करें।

CSV का एक संक्षिप्त इतिहास, इसे define करने वाले spec से भी पुराना

CSV वह format है जिसे सभी use करते हैं और जिसका कोई owner नहीं है। इसकी lineage informal है। comma-separated convention के सबसे पुराने documented usage की तारीख 1972 है, जब IBM Fortran (level H extended) ने list-directed input/output support किया जहाँ commas एक line पर values के बीच separators के रूप में serve करते थे। 1970s और 1980s के दौरान, हर database, spreadsheet, statistics package और accounting application जिसे किसी दूसरे tool के साथ data swap करना था, ने independently «values separated by some character on lines separated by some other character» का कोई variant invent किया। कोई spec नहीं था। कोई governing body नहीं था। कोई canonical implementation नहीं था। बस consensus था, सबसे loose possible sense में।

2000s की शुरुआत तक, chaos की cost को ignore करना impossible हो गया। IETF ने eventually एक specification accept की, RFC 4180, «Common Format and MIME Type for Comma-Separated Values (CSV) Files,» Yakov Shafranovich द्वारा अक्टूबर 2005 में published। RFC 4180 short है, बस कुछ pages, और इसने वह codify किया जिस पर अधिकांश लोग पहले से converge हो चुके थे: field separator के रूप में comma, ऐसे fields के लिए optional enclosure character के रूप में double quote जिनमें commas या quotes या newlines हैं, quoted field के अंदर literal quote escape करने का तरीका doubled double-quotes (""), line terminator के रूप में CRLF, और IANA के साथ registered MIME type के रूप में text/csv। spec ने MIME type के लिए optional header parameter भी define किया ताकि sender receiver को बता सके कि क्या पहली line header row है।

RFC 4180 informational है, strict standard नहीं। इसका compliance voluntary है। लेकिन यह हमें एक target देता है, CSV के «correct» की definition के सबसे करीब की चीज़। एक बाद का document, W3C «Model for Tabular Data and Metadata on the Web» (CSVW, 2015), ने CSV के metadata story को extend करने की कोशिश की एक JSON sidecar attach करके जो बताता है कि प्रत्येक column क्या है और इसे कैसे interpret किया जाए। CSVW widely cited है और rarely deployed।

practical world में «CSV» का अर्थ RFC 4180 की definition से अलग है

जो भी किसी अजनबी से CSV प्राप्त करना पड़ा है वह problem की shape जानता है। disagreements कई axes पर break down होते हैं:

BOM trap

इस section का अपना स्थान deserves है क्योंकि यह cross-platform CSV pain का सबसे common source है। Microsoft Excel UTF-8 encoded CSV को auto-detect नहीं करेगा जब तक file UTF-8 byte order mark से शुरू न हो: तीन bytes EF BB BF, जो Unicode character U+FEFF encode करते हैं। BOM के बिना, Excel file को user के Windows locale के legacy code page में open करता है (West में Windows-1252, Japan में Shift_JIS, mainland China में GBK)। कोई भी non-ASCII character (accented letters, currency symbols, emoji, CJK characters) mangled हो जाता है।

fix BOM prepend करना है। cost यह है कि बाकी सब इस पर choke करते हैं। Apple Numbers (recent versions तक) first cell में BOM को literal character के रूप में दिखाता है। कई command-line tools (awk, cut, older sed) BOM को first field का हिस्सा मानते हैं, इसलिए name read होना चाहिए था वह header name read होता है। अधिकांश JavaScript CSV parsers इसे strip करते हैं; कई older Python csv-module workflows नहीं करते (आपको utf-8-sig codec के साथ file open करनी होगी)। चूँकि एक free online tool यह नहीं जान सकता कि user file कहाँ open करेगा, BOM omit करना और document करना कि Excel users को Data → From Text/CSV use करना चाहिए (जो हमेशा user को explicitly UTF-8 pick करने देता है) एक reasonable default है।

Excel कम से कम चार «CSV» formats ship करता है

Excel का «Save As» dialog एक से अधिक CSV variant offer करता है, और differences matter करते हैं:

user-facing label «CSV» को चार अलग-अलग तरीकों से कहता है। actual file content materially different है। यह वह practical reality है जिसके अंदर converter operate करता है।

specifically text → CSV convert क्यों करें

अधिकांश online «CSV tools» inverse direction run करते हैं: एक CSV लें, कुछ और emit करें (JSON, HTML table, SQL INSERT, printable PDF)। यह उल्टा run करता है: messy text लें, clean CSV produce करें। यह use case है:

Excel आपका data rewrite करेगा, कभी-कभी silently

कुछ CSV foot-guns careful users को भी bite करते हैं:

CSV के modern alternatives में इस tool का स्थान

CSV survive करता है क्योंकि यह text है और humans इसे read कर सकते हैं। serious data interchange के लिए, कई formats ने specific dimensions पर इसकी जगह ले ली है:

developers और office workers के लिए targeted एक free online converter के लिए, CSV सही output format बना रहता है क्योंकि यह data import हर जगह की lingua franca है। Modern alternatives exist; उन्होंने inbox में CSV को displace नहीं किया है।

अधिक प्रश्न

क्या मुझे output में UTF-8 BOM add करना चाहिए?

अगर file Windows पर Excel double-click के लिए destined है, हाँ, BOM के बिना, Excel इसे legacy code page में open करता है और non-ASCII text को mangle करता है। अगर यह किसी और चीज़ के लिए destined है (Apple Numbers, command-line scripts, web upload forms), BOM omit करें। सबसे safe path BOM omit करना और Excel users को instruct करना है कि Data → From Text/CSV के through import करें, जहाँ वे explicitly UTF-8 choose कर सकते हैं।

मेरी CSV Excel में एक cell per row के साथ open होती है, क्या गलत हुआ?

लगभग हमेशा separator mismatch। आप एक ऐसे locale में हैं जहाँ Excel semicolons expect करता है (continental Europe के अधिकांश भाग), लेकिन file commas use करती है, या vice versa। double-clicking के बजाय Data → From Text/CSV के साथ open करें; वह wizard आपको delimiter explicitly choose करने देता है। या file को Excel के Save As menu से उस variant के साथ save करें जो आपके local separator से match करे।

TSV और CSV के बीच क्या अंतर है?

TSV commas के बजाय separator के रूप में tab characters use करता है, अपने MIME type text/tab-separated-values और IANA registration के साथ। TSV का advantage यह है कि real-world data में literal tabs rarely होते हैं, इसलिए quoting की लगभग कभी आवश्यकता नहीं होती; disadvantage यह है कि tabs text editors में invisible हैं और copy-paste behaviour vary करता है। CSV की quoting machinery इसे उन fields के लिए safe बनाती है जिनमें delimiter होता है; TSV mostly problem को पूरी तरह avoid करता है।

क्या मेरी file share करने से पहले run करने के लिए कोई CSV linter है?

हाँ, command-line use के लिए, csvkit का csvclean wrong number of columns वाली rows report करता है। Frictionless Data का frictionless CLI एक optional schema के विरुद्ध validate करता है। Browser-based work के लिए, PapaParse line-by-line parse errors report करता है। RFC 4180 के विरुद्ध strict validation (CRLF line endings, doubled-quote escaping) practice में rare है; अधिकांश parsers common variants में से किसी को भी accept करते हैं।

संबंधित टूल