[Sarlug] Распарсить CSV
Тарас Перебейносов
taras.perebeynosov на gmail.com
Пн Дек 3 12:48:31 MSK 2012
ОК, кто может помощь с sed?
Хочу вычленить из строк вида:
First Last 17.01MB
отдельно First Last и отдельно размер. Причем там могут быть еще и KB, т.е.
это тоже придется учесть.
Но пока завис на написании RegExp под sed.
$ echo 'First Last 17.01MB'|sed -e 's/\([a-zA-Z]+ [a-zA-Z]+\)
\([0-9]*\)[KMB]/\1:\2/g'
First Last 17.01MB
Он походу не понимает значек +
Может есть где толковое описание regexp под sed? он там явно отличается от
классического...
2012/12/3 Тарас Перебейносов <taras.perebeynosov на gmail.com>
> Ну да) только у меня MS Office и да, он открывает как надо) Но мне надо
> без иксов.
>
>
> 2012/12/3 Aleksei Sinitsyn <a.sinitsin на gmail.com>
>
>> 3 декабря 2012 г., 11:58 пользователь Тарас Перебейносов
>> <taras.perebeynosov на gmail.com> написал:
>> > ЛО-калк - это что такое)?
>> >
>>
>> LibreOffice. Откроет как таблицу.
>>
>> >
>> > Оказалось он просто в UTF-16
>> >
>> > od -c Storage_Utilization_12-03-12.csv | head
>> > 0000000 377 376 " \0 A \0 l \0 l \0 \0 s \0 e \0
>> >
>> > Решается так:
>> >
>> > iconv -f utf16 -t utf8 Storage_Utilization_12-03-12.csv >
>> > Storage_Utilization_12-03-12-1.csv
>> >
>> > 2012/12/3 Sergey Mihailov <sergey.mihailov на gmail.com>
>> >>
>> >> Дожили :( Ну загрузи его в ЛО-калк ...
>> >>
>> >>
>> >> 3 декабря 2012 г., 11:41 пользователь Dmitry Agafonov
>> >> <dmitry на agafonov.pp.ru> написал:
>> >>
>> >>> Если вдруг имена пользователей на кириллице и там cp-1251 - вполне
>> >>> реально
>> >>>
>> >>>
>> >>> 3 декабря 2012 г., 11:39 пользователь Тарас Перебейносов
>> >>> <taras.perebeynosov на gmail.com> написал:
>> >>>>
>> >>>> Друзья,
>> >>>> помогите, плиз, решить несложную задачку по распарсиванию файлика.
>> >>>>
>> >>>> Есть файл CSV, полученный с одного интернет-сервиса. Нужно из него
>> >>>> вытянуть инфу, отсортировать и потом произвести некоторые действия.
>> >>>>
>> >>>> Наткнулся сразу на такую фигню:
>> >>>> $ less Storage_Utilization_12-03-12.csv
>> >>>> "Storage_Utilization_12-03-12.csv" may be a binary file. See it
>> anyway?
>> >>>>
>> >>>> Это притом что файл под виндой открывается блокнотиком, да и даже
>> tail
>> >>>> выдает вполне себе текс:
>> >>>>
>> >>>> $ tail Storage_Utilization_12-03-12.csv
>> >>>> User1 124KB
>> >>>> User2 201KB
>> >>>> User3 4.52MB
>> >>>>
>> >>>> --
>> >>>> With best regards,
>> >>>> Taras.
>> >>>>
>> >>>>
>> >>>> _______________________________________________
>> >>>> Sarlug mailing list
>> >>>> Sarlug на lists.lug.ru
>> >>>> https://lists.lug.ru/mailman/listinfo/sarlug
>> >>>
>> >>>
>> >>>
>> >>>
>> >>> --
>> >>> Dmitry Agafonov ~ http://agafonov.pp.ru/
>> >>>
>> >>> _______________________________________________
>> >>> Sarlug mailing list
>> >>> Sarlug на lists.lug.ru
>> >>> https://lists.lug.ru/mailman/listinfo/sarlug
>> >>
>> >>
>> >>
>> >>
>> >> --
>> >> mx
>> >>
>> >> _______________________________________________
>> >> Sarlug mailing list
>> >> Sarlug на lists.lug.ru
>> >> https://lists.lug.ru/mailman/listinfo/sarlug
>> >
>> >
>> >
>> >
>> > --
>> > With best regards,
>> > Taras.
>> >
>> >
>> > _______________________________________________
>> > Sarlug mailing list
>> > Sarlug на lists.lug.ru
>> > https://lists.lug.ru/mailman/listinfo/sarlug
>>
>>
>>
>> --
>> WBR, sinaps. http://saratov.lug.ru
>> JID:sinaps на jabber.org gtalk:a.sinitsin
>> _______________________________________________
>> Sarlug mailing list
>> Sarlug на lists.lug.ru
>> https://lists.lug.ru/mailman/listinfo/sarlug
>>
>
>
>
> --
> With best regards,
> Taras.
>
>
--
With best regards,
Taras.
----------- следующая часть -----------
Вложение в формате HTML было удалено...
URL: <http://lists.lug.ru/pipermail/sarlug/attachments/20121203/c79fccc8/attachment.html>
Подробная информация о списке рассылки Sarlug