标签: Csv
transposedata-processingtsv
我有一个二维网格上的值的大数据文件。
它们的组织方式使得网格中的后续数据行是文件中的后续行。
每列由制表符分隔。
本质上,这是一个CSV文件,但带有选项卡而不是列
我需要转置数据(第一行变成第一列)并将其输出到另一个文件。最好的方法是什么?任何语言都可以(我更喜欢使用Perl或C/C++)。目前,我使用Perl脚本将整个文件读入内存,但我使用的文件非常庞大。最简单的方法是对输入进行多次传递,每次传递时提取列的子集。列数由您想要使用的内存量和输入文件中的行数决定
例如:
在pass1中,您读取整个
标签: Csv
hsqldbin-memory-database
我有一个应用程序/工具,可以从CSV文件中读取数据并写入另一个文件,使用HSQLDB进行处理
我想把CSV文件作为唯一的输出,数据库文件应该在进程完成后消失
我尝试使用mem存储,但这会阻止HSQLDB写入CSV文件
我还试图在关闭连接之前删除模式,但这不会删除文件
我不喜欢手动删除文件,因为这是特定于HSQLDB实现的,并且会随着时间的推移而改变
是否有系统的方法只保留CSV文件?
理想情况下,我想要一些选项,允许HSQLDB在使用内存存储时写入CSV文件。HSQLDB从不删除自己的文件。
我有CSV文件,其中有多个排序列。例如,我可能有这样的行:
19980102,,PLXS,10032,Q,A,,,15.12500,15.00000,15.12500,2
19980105,,PLXS,10032,Q,A,,,14.93750,14.75000,14.93750,2
19980106,,PLXS,10032,Q,A,,,14.56250,14.56250,14.87500,2
20111222,,PCP,63830,N,A,,,164.07001,164.09000,164.12
我有一个ImportCommand类,它读取文件并将数据从该文件导入数据库。命令本身运行良好
但是,我需要使用不同的文件多次运行同一命令
My.bat文件:
@echo off
cd c:\xampp\htdocs\mysite\protected\
yiic import c:\sourcefiles\users_1.csv
yiic import c:\sourcefiles\users_2.csv
yiic import c:\sourcefiles\users_3.csv
第一个命令运
我想使用sed以默认值将一些列添加到下面的csv文件中
我的文件如下:
40,2012-05-30,London,61,Sunny
41,2012-02-22,Moscow,11,Snow
54,2012-04-10,Tokyo,02,Sunny
我希望输出为:
40,2012-05-30,NULL,London,NULL,NULL,61,Sunny,Tom
41,2012-02-22,NULL,Moscow,NULL,NULL,11,Sunny,Tom
54,2012-04-10,NULL,
这适用于Neo4j里程碑版本2.1.0-M01。我一直在尝试导入这个小的.csv文件:
我为D列尝试了四种不同的格式
类型:“俱乐部”
类型:俱乐部
类型:俱乐部
俱乐部
我的密码查询:
LOAD CSV FROM "file:<PATH_TO_FILE>/Soccer_players.csv" AS line
MERGE (p:Player {name: line[0]})
MERGE (t:Team {name: line[1]})
CREATE (p)-[:PLAYS_F
我正在努力让我的choropleth地图工作。我有一个CSV文件,其中包含要与我的TopoJSON地图匹配的值和地区名称。CSV地图上的数据如下所示:
id, values
NAIROBI,50
MOMBASA,10
KWALE,20
KILIFI,40
TANA RIVER,50
LAMU,10
id列代表肯尼亚的地区名称,其值是任意的,仅用于根据我正在使用的阈值范围的域集生成颜色。由于某些原因,颜色无法生成。这是我剩下的代码。请告诉我哪里出了问题?我一直试图修复它,但毫无效果:
<!
我正在尝试导入一个大的CSV文件(大约7k个变量和355个观察值)。Proc Import在~2k列之后停止读取变量名,我不确定原因。我发现使用infle可以将整个csv转换成SAS,但是变量名在第一行,变量名为v1 vn。我只需要从第一行获取变量名,然后使用这些名称修改/重命名我的数据集
到目前为止,我已经:
使用infle和transpose将我所有的变量名放到单独数据集中的一列中。
使用proc sql将此列选择到列表中。
用宏和这个列表在键盘上敲了一天半,试图修改原始变量名
data L
我的任务是Fortran程序,它计算csv文件中每行的整数数。该文件的格式如下:
10,2,5,6,7,8
1,5,6,7
201,55,26,47,8,8,9,10
....
每一行都有不同数量的数字。我需要按下面的格式进行计数和重新排列
6 10 2 5 6 7 8
4 1 5 6 7
8 201 55 26 47 8 8 9 10
...
第一个整数是文件每行中的整数数。以下整数与文件中的行相同。但逗号应该删除。我的第一个方法是通读整行并继续。但似乎很难处理未知长度的线
charact
在prestashop中添加新产品、类别、cms页面时,您可以通过从字段左侧的下拉列表中选择语言,在同一窗口中添加描述或产品标题的翻译
当我通过prestashop中的CSV导入链接导入产品时,我可以选择*.CSV文件的语言。好啊这确实有效…但这会在我的产品列表中生成两个产品,例如(德语翻译):
我的新Ipod
我的新Ipod
类别也是如此,它并没有真正将它们合并为一个类别,您将得到:
艺术
昆斯特
我试图使*.csv文件中的ID字段与主语言和翻译语言相同,但这似乎不起作用
因此,我的问题是,p
我能够使用Data.csv中的以下代码解析我的csv文件:
valuesToList :: Foo -> (Int, Int)
valuesToList (Foo a b) = (a,b)
loadMyData :: IO ()
loadMyData = do
csvData <- BL.readFile "mydata.csv"
case decodeByName csvData of
Left err -> putStrLn err
导出到csv时,如何从web2py网格中的csv中排除列
self.rows.export_to_csv_file(s, represent=True, write_colnames=False)
请帮忙 如果手动调用export_to_csv_file方法,而不是使用网格内置的csv下载功能,则该方法采用colnames参数,该参数允许您指定要包含的列(默认为行对象中的所有列)
我有一本给我的表格工作簿。我打开它,我看到了那里的一切
我想将数据导出到CSV,包括一系列总和的度量值。目前,这些措施在右侧的4个“列”中,但不在列架中
如何将其转换成CSV格式,以便将其通过R。这让我抓狂…了解更多细节会有所帮助。例如,您是要导出聚合度量值(总和),还是要导出构成这些总和的基础数据行
导出数据的方法有很多种,但您可以从使用工作表->导出->数据菜单导出当前工作表上显示的数据开始。为了保持整洁并节省处理能力,在这种情况下,我喜欢做的是将所有维度和度量值拖动到细节,而不是行或列
我
我无法使用logstash将数据加载到本地主机上的弹性搜索节点。。。我想让logstash读取csv文件并将这些数据加载到elastic search。但这一切都不起作用,我只能手动读取添加到弹性搜索中的数据,似乎logstash什么都不做
我的日志存储配置如下:
input {
file {
path => [ "C:\Users\Michele\Downloads\logstash-1.5.3\logstash-1.5.3\Users\*.csv&qu
我有一个csv文件,其中的字段中有换行符,如下所示:
"abc" , "adef
efw", "abc"
"abc","awe","abc"
应该是:
"abc", "adefefw","abc"
"abc","awe","abc"
有人知道一些工具或脚本来解决这个问题吗?我更喜欢使用Vim。您可以将preg_replace()函数与PHP一起使用,但需要解析CSV
另一个选项可能是在PHP中使用str_getcsv()函数
第页的示例
<?php
$csv = ar
有一个以CSV格式提供给我的示例数据集。
虚拟数据集如下所示:
Baseball1,Baseball2
USA,France
USA,Italy
USA,England
England,USA
England,Australia
England,Sri Lanka
France,USA
France,England
France,Italy
Italy,USA
Italy,France
Italy,England
我需要得到一个输出数据,其中的数据只有descrete值。
所需输出如下:
Ba
所以,我目前正在编写一个iMacros脚本,出现了这个错误。
执行以下操作时:
文件删除名=
或
SAVEAS TYPE=提取文件夹=
我们可以指定一个文件夹,如何使用变量指定文件夹?
我的意思是像%USERPROFILE%,因为不是每个人的用户名都是Admin/Administrator等。。。
因为这是我想做的(不起作用):
我之所以这样做,只是因为一些浏览器“跟踪”自动化并禁用了一些功能,而不是通过这种方式(使用C:\Users\Administrator\Documents\iMacro
这是一个问题的后续帖子
我正在尝试将.csv中的数据放入.mdb(MS Access 2000)
如果数据库存储在我的硬盘上,但它位于我通过网络访问的另一个驱动器上,那么这个脚本工作得非常好。我在那里有完全的权利,我可以手动插入新的数据集,没有任何问题
'There are several other Subs in this .hta-file
'these two are specified along with some other public variables
'in the beg
我有79个字段的CSV文件。但我只需要它的14个字段。所以我需要用这14个字段生成一个CSV文件。这是需要安排的日常流程。
我用下面的命令创建了一个批处理文件
FOR /f "tokens=1,7,17,18,28,29,31,34,39,61,62,66,71,73 delims=," %%B in (C:\Users\c6372\Desktop\xmltocsv\Fulldata_withheaders.csv) do @echo %%B,%%C,%%D,%%E,%%F,%%G,%%H,%%
我有一堆.csv文件,这些文件是从外部生成的,定期发送给我。它们每个都包含一行31个“列”的文本。但是,它们都没有任何类型的EOL(本身没有LF,也没有CR),因此当我尝试组合这些文件时,我会在同一行上获得更多列,而不是每个文件一行
我想一种方法,自动添加到这些文件的每一批结束,与输出具有相同的文件名为原始文件,可能与一个字符添加在名称的开始,所以我新的这个过程已经完成例如:originalFile.csv>>1_originalFile.csv
我曾试图创建一个名为“eol.csv”的文件,该
我试图使用csv模块来解析一个特定格式的分隔文件。我正在使用Python 3.5
格式由第三方提供,我在使用csv模块提供所有情况下的表示时遇到问题。任何指定为文本数据类型的列都具有双引号值。日期和数字在管道之间不会有任何引号值(分隔符)。问题在于,在尝试多种格式时,我要么留下一个中间的双引号,要么丢失\->空格之类的信息。我希望我不必为此使用正则表达式,所以如果csv模块能解决这个问题,那就太好了
规则:
转义字符是一个“\”
制表符转义:\t
新行字符:\n
反斜杠字符:\\
内引号字符:
我正在尝试使用Powershell搜索csv文件并在csv文件中输出重复行列表。我可以通过以下几点在bash中轻松实现这一点:
uniq -d myfile.csv > list.csv
在Powershell中,我可以输出唯一行的列表,但是如何修改Get unique以仅显示重复行,就像在bash中一样
Get-Content c:\file\myfile.csv | Get-Unique | Set-Content c:\file\list1.csv
使用独特的工具获取副本有点奇怪
我正在尝试获取文件和文件夹的权限,并将其导出到csv文件。我可以在屏幕上显示信息,但当我尝试导出它时,生成的csv文件是空的
守则:
function Test-IsWritable(){
<#
.Synopsis
Command tests if a file is present and writable.
.Description
Command to test if a file is writeable. Returns t
我得到了一个脚本,它与csv文件密切相关。在这些文件中存储了不同类型的数据。在某些时候,我想从这些文件中删除条目
当我想删除单个条目时,我会这样做:
$csv = Import-Csv -Path $path -Delimiter ";"
$selectedEntry = $csv | Out-GridView -Title $title -OutputMode Single
$csv = $csv -notmatch $selectedEntry
$csv | Export-Csv $path
我有一个类似于以下链接的问题:
我已尝试将其应用于我的脚本(如下),但出现以下错误:
SyntaxError: unterminated string literal, line 12 (Error code: -1001)
第12行是:
SET col EVAL("var col=eval('[{{row}}]'); col[{{!VAR1}} - 1];")
下面是我的完整脚本,带有相同的问题,需要从.CSV文件中输入文本,但iMacros READ列由用户选择,介于1到10之间
VE
我有一个很大的CSV文件,我正试图用Powershell导入0.5-2gb+的文件
数据看起来是这样的:
姓名、日期、价值
“乔,约翰”,2016-08-01,“价值”
“史密斯,简”,2016-08-01,“价值”
我有这个功能
$elapsed = [System.Diagnostics.Stopwatch]::StartNew()
$reader = new-object System.IO.StreamReader($csv)
while (($line = $reader.Read
我用一个php脚本将reddit文章的一组数据属性抓取到一个csv中,在抓取这些文章之后,我需要在接下来的24小时内每小时监控每篇文章的状态。我有Title、ID、Name、No of comments和Domain等属性,但我目前无法找到一种方法,仅使用这些属性访问每个/相应的reddit帖子
有谁能告诉我一种使用列中的任何数据访问此csv中每个reddit帖子的方法吗?帖子URL中使用了id字段,如下所示:92dd8变为,相当于(除了缺少subreddit样式)
您还可以将/api/inf
我有一个CSV文件
author,host,authority,contents
_angelsuman,http://twitter.com/_angelsuman,5,green tea piyo :( #kicktraileron6thjune
_angelsuman,http://twitter.com/_angelsuman,5,rt @121training fat burning foods: grapefruit watermelon berries hot peppers
标签: Csv
matchsublimetextwords
我正在寻找一种方法,一次从多个单词中找到多个匹配项。
基本上与示例中的选择相匹配,但同时使用多个单词,因此可以从更大的列表中提取数据
以下是一个例子:
1列表约200行的较小列表包含以下内容:
xWDL15-B01
xWDL15-CD01
xWDL15BM-V02
xWDL15-V01
xROHVS10-V09
xDAEMBEK13-V09
xFEBG16_V10
但我有另一个列表,有1500行,在其他行之间混合,我有很多额外的信息,我需要添加到列表中
xWDL15-B01;数据2;数据
我正试图在我的第一个Drupal8中导入一个包含480行和20列的csv“houses”。
我用这个
我在Admin中创建了一个包含多个自定义字段的内容类型“Group”
我创建了配置文件,正如我们在
我不使用Drush,我在公司服务器上使用ftp传输。我不知道我是否可以使用drupal管理或其他模块来完成
现在配置文件没有通过导入验证,我修复了多个错误,但仍然不正常。
你有一些配置文件的例子吗?德鲁什的替代品?还是在D8上导入CSV的另一种方法?
谢谢! 多亏了drupal.slack,几天后
我已经在网上到处寻找解决方案,但似乎没有任何东西对我有效。我需要从几个数据库中查询数据,这非常复杂,因此我决定使用Python连接到RDS并执行这些查询(通过Pandas)。熊猫将此数据导出到csv文件中。现在我在Tableau服务器上有了使用这些数据的仪表板,但是当我更新csv文件时,仪表板不会更新
如有任何见解,将不胜感激 有几种方法可以做到这一点。您可以创建数据提取并将该提取发布到服务器。这允许其他用户根据自己的需要连接到该数据源。Tableau server为用户提供了一个选项来计划提取
标签: Csv
Unix
pipeparameter-passingdelimiter
我已经编写了一个通用unix脚本来从任何csv加载oracle表。现在csv中的delimeter(字段分隔符)可以是“,”或“|”或“:”等。
因此,我试图将delimeter作为一个参数显式传递给脚本,它对大多数delimeter都很好,但当我试图传递时,它没有给我正确的结果,因为它隐式地转换为
ksh -x myscript csv_name |
#不起作用
ksh -x myscript csv_name ,
#工作
请建议我是否有用于此的转义?在我的机器中测试,您需要使用以下命令
我有一个有一个键和多个列表值的字典
{'A-03131': [['Component', 'P-011510', '5'], ['Component', 'P-011319', '1'], ['Component', 'A-03134', '1'], ['Component', 'P-009591', '1'], ['Component', 'P-011509', '1'], ['Component', 'P-011461', '1'], ['Component', 'P-011563', '1
我有一个逗号分隔的csv文件。但在我的机器中,控制面板中“区域和语言”选项的“列表分隔符”中的值为分号(;)。由于其他原因,我无法在设置中更改此分号值。
当我试图在编辑后将文件另存为csv时,由于系统设置中的值,文件将以分号分隔。
是否可以通过提及文件本身中的分隔符值来覆盖系统设置?因此,当我将此文件保存为csv时,分隔符仍然是逗号而不是分号。我是否可以使用sep=。尝试编写保存文件的宏
ActiveWorkbook.SaveAs "filename", FileFormat:=xlCSV, l
我是neo4j的新手,我面临一个罕见的问题,即在创建了不同customerID的4359个节点和不同ProductID的3676个节点之后,并且在为我创建的所有ProductID创建它们之间的关系时,为该ProductID创建的关系较少。假设在CSV文件中,我为该特定id创建了479列productID,但当检查传入边的计数时,结果为477。所有ProductID都会发生这种情况
提前感谢请分享您的代码。。。您是否使用合并?您的数据中是否可能存在两个重复项?首先,我创建了所有唯一的Custome
我需要使用awk解析、迭代.tsv文件
文件路径正确,已在终端中测试。
获取错误“cat:./datalist.tsv没有此类文件或目录”
tsv文件有几行,以制表符分隔。计划是循环浏览tsv文件内容
这是我的代码,用于filename.awk:您不必使用cat来读取TSV文件。相反,直接读取文件即可
例如:
#!/bin/gawk
BEGIN {
FS = "\t"
OFS = ","
ORS = "\r\n"
while (( getline < "da
我正在使用Robotframework和CSVLibrary编写随机生成的字符串。写入CSV时出错。以下是代码
${datalist} CREATE LIST
${list}= getmandatory test.xml testInfo
: FOR ${a} IN @{list}
\ ${random}= String.Generate Random String
我正在尝试使用跳过第一行并在camel中使用贴图。我的版本是2.17或2.17.0.redhat-630310-它似乎不工作???另外,想知道如何在XMLDSL中使用USESETMAPS选项吗?谢谢大家!
<route>
<from uri="direct:start" />
<unmarshal>
<csv skipFirstLine="true" />
</unmarshal>
</route>
另
我有一个像这样的csv文件
"ID","NAME","TIME"
"858","abc","21:38:52"
"874","ghi","18:20:33"
"858","abc","19:38:52"
"978","def","21:38:52"
"874","ghi","13:20:33"
"319","ghi","13:24:50"
"319","ghi","22:29:16"
有些记录是相同的,只是时间不同(见第三列),基本上我只想要最新的记录。我需要一个命令来识别重复的记录并删除那些
我正在使用apoc.periodic.iterate和apoc.load.csv加载csv文件,但我总是失败,并说存在NullPointerException:
neo4j> CALL apoc.periodic.iterate('
CALL apoc.load.csv("http://128.194.9.150:9999/On_Time_On_Time_Performance_2018_1.csv", {}) yield map as row return row
我从Google云存储创建了一个BigQuery表。
我使用选项:gs://my_bucket/*.csv
Google Cloud Storage URIs begin with "gs://" and specify the bucket and object you want to load.
Example: gs://mybucket/path/to/mydata.csv
You can use a wildcard to load multiple files, for exam
我是NetLogo的新手,所以这可能是个愚蠢的问题。
当我尝试将Turtle、补丁、全局变量导出到单独的CSV文件时,这一个可以工作:
csv:归档海龟的“turtles.csv”[(列出xcor或ycor颜色形状)]
但以下两种情况并非如此:
csv:归档补丁的“patches.csv”[(列出xcor或ycor群集编号)]
错误:此代码不能由修补程序运行,只能由海龟运行
csv:to file“statistics.csv”(列出满足agg meetown meetown agg meeto
假设我在同一个目录中有多个CSV文件,这些文件都共享相同的模式
/tmp/data/myfile1.csv、/tmp/data/myfile2.csv、/tmp/data.myfile3.csv、/tmp/datamyfile4.csv
我希望将这些文件读入Spark数据帧或RDD,并且希望每个文件都是数据帧的一部分。我怎样才能做到这一点?我可以想到两个选择:
1)使用输入文件名
不要试图直接控制分区,而是将输入文件的名称添加到数据帧中,并将其用于需要执行的任何分组/聚合操作。这可能是您最好的选
我正试图将一些CSV文件从Google云存储加载到BigQuery中,并努力解决模式生成问题。有一个自动生成选项,但它的文档很少。问题是,如果我选择让BigQuery生成模式,它可以很好地猜测数据类型,但有时它会将数据的第一行识别为标题行,有时则不会(将第一行视为数据,并生成字符串\字段\ N之类的列名)。我的数据的第一行始终是标题行。有些表有很多列(超过30列),我不想弄乱模式语法,因为当模式出现问题(我不知道是什么问题)时,BigQuery总是会弹出一条无信息的错误消息
那么:如何强制它将第
给出了一个输入文件,其中每行包含每列的引号和回车/换行字符
如果该行包含新行,则必须在同一行中追加新行
引号内的行,例如第1行
如果分隔符(,)为空,则删除每列的双引号
不在场
删除回车符,即(^M)
举例来说,给定以下输入文件
"name","address","age"^M
"ram","abcd,^M
def","10"^M
"abhi","xyz","25"^M
"ad","ram,John","35"^M
我希望通过sed/perl/awk脚本/oneliner获得以下输出
na
我必须开发一个项目,其中我必须从.csv文件中读取数据,如下所示:
10,12.1
15,25.6
15,25.1
...
所以我试着阅读如下:
.data
file: .asciiz "/home/gilson/Documents/test.csv"
.word 0
buffer: .space 4
.text
main:
#open file
li $v0, 13
la $a0, file
add $a1, $zero, $zer
我在JMeter中设置了一个SMTP采样器,它从csv文件中获取主体数据。它读取第一个元素,然后停止。对可能出现的问题有什么建议吗
CSV文件如下所示:
"This is
a multiline
record
"`"This is
a seond
multi line
record
"`"And this is a third record"
结果
配置
根据
JMeter支持带有引用数据的CSV文件,其中包含新行
默认情况下,
根据apachecamel中的“bindy”组件。
我试图用kotlin解组简单的csv文件,但没有创建pojo文件值
我认为问题在于与科特林解除武装
型号->
@CsvRecord(separator = ",", skipField = true)
data class Product(
@DataField(pos = 1, required = true)
var id: String? = null,
@DataF
我试图从android 11的存储中选取csv文件,但它不起作用
我的代码是:
val uri = FileProvider.getUriForFile(this, BuildConfig.APPLICATION_ID + ".FileProvider", Utils.getDirectoryPath(this)!!)
val intent = Intent(Intent.ACTION_GET_CONTENT)
intent.addCategory(I
我想从我的CSV文件中获取多个值,我的CSV文件如下所示,但它有数百行:
姓名,通行证,身份证,身份证,身份证
xyz1,pas1,i1,a_01,f_01
xyz2,pas2,i2,a_02,f_02
xyz3,pas3,i3,a_03,f_03
xyz4,pas4,i4,a_04,f_04
..
等等
我要进行的调用需要同时访问多个值
因此,在我的身体数据中,我希望从上面访问多个行值,如下所示:
[
{
"Name":"${Name}", //
1 2 3 4 5 6 ...
下一页 最后一页 共 86 页