Marklogic内容泵(MLCP)以静默方式忽略以下划线开头的文件

我正在尝试导入一个文档集合,其中一些文件以下划线开头。Marklogic mlcp 8.0.4似乎在默默地跳过这些文件,尽管Marklogic本身似乎对这样的文件名没有问题 这是我正在使用的mlcp命令: mlcp-8.0-4/bin/mlcp.sh导入-主机本地主机-端口8012-用户名 xxxxx-密码xxxx-模式本地-输入文件路径 /用户/test/Downloads/tempfolder33/-output\u uri\u replace ^.*临时文件夹33,' mlcp始终忽略“/

使用java客户端api从MarkLogic数据库提取结果

我是MarkLogic数据库的新手。我的用例是: 我正在尝试使用Java客户端api连接到MarkLogic数据库。我的JSON文档存储在数据库中,其中tradingDate(日期类型)作为字段之一。现在我想获取tradingDate小于特定日期的所有文档 有人能告诉我如何继续吗?我建议调查: 通过转换输出 或者使用类似的东西 嗯 我尝试了以下示例,并使用marklogic中的“示例查询”使其正常工作:- val queryMgr = client.newQueryManager(); v

Marklogic search:使用jsearch仅输出匹配元素和文档的uri

我不熟悉MarkLogic。我正在寻找一种方法,在使用jsearch时只从文档中输出匹配的元素,但是在执行查询时,不知道要与搜索词匹配的元素。让我举例说明: jsearch.documents() .where(cts.wordQuery('mark')) .result(); 这给了我所有包含“标记”的文档,例如 { "results": [ { "index": 0, "uri": "/books/twain4.json", "score": 1

Marklogic XDMP-BADCHAR:找到意外字符'\&引用';

我试图通过API启动以下Xquery查询(我遵循了链接:) 它适用于基本示例,但当我尝试使用查询从ML提取数据并将其保存到磁盘时,出现以下错误: {"errorResponse":{"statusCode":500, "status":"Internal Server Error", "messageCode":"XDMP-BADCHAR", "message":"XDMP-BADCHAR: (err:XPST0003) Unexpected character found '\"' (0x00

如何在MarkLogic中转义xml字符串中的特殊字符?

我有一个来自Java的base64编码格式的XML字符串 PHJvb3Q+PGNoaWxkPiY8L2NoaWxkPjxjaGlsZD48PC9jaGlsZD48Y2hpbGQ+PjwvY2hpbGQ+PGNoaWxkPns8L2NoaWxkPjxjaGlsZD59PC9jaGlsZD4vcm9vdD4= 我使用xdmp:base64-decode()对其进行解码。它给我的输出是 <root><child>&</child><child>

Marklogic 9重新平衡器无法使用分配的查询策略

我试图通过查询分配策略对Marklogic 9进行分层。我在“Documents”数据库中创建了2层(作为分区),分区名称如下: Part1,分区号为1,默认分区(无指定查询) 第二部分,分区号是2 在数据库中,文档存储为JSON,我想根据文档的do“DYil”属性对它们进行分层 数据库中存在的JSON文档示例: { “耶勒西姆”:“伊兹密尔”, “广告”:“AAA”, “@时间戳”:“2018-06-02T21:16:23.647Z”, “大豆”:“BBB”, “@version”:“1”

MarkLogic日志大小参数

我对MarkLogic中的“日志大小”参数有一个问题。 默认设置为2GB,这是否意味着内部的日志目录 森林目录永远不会超过2GB? (我找不到最大日志大小、数量或日志参数)它是日志目录中单个日志文件的最大大小。每个内存支架都有自己的日志文件,以便在发生事故时重放写入内存支架的内容。因此,它限制了您在单个事务中可以更新的数量。如果日志空间不足(例如,超过活动日志文件的最大大小),事务将失败 一旦内存中的支架成功写入磁盘,就应该清理日志文件。通常,每个林中只有一个记忆中的林分 嗯 它是Journal

Marklogic 生成多个线程以删除多个相同元素时出错

我想删除重复2353218次的相同元素,在xml中只保留一个。试图生成进程,但出现以下错误。如果没有繁殖,这将花费太多时间。请帮忙 xquery version "1.0-ml"; let $input := doc("http://www.somedomain.com/name/12345.xml")/xpath/toMultipleElement[2 to last()] let $batch-size := 50000 let $input-size := f

Marklogic 如何使用dmsdk从数据库中获取文档并将其传递给转换?

我需要从数据库中获取文档,并使用dmsdk应用转换。 我使用以下代码行成功地从数据库中获取了文档: QueryManager queryManager=client.newQueryManager(); StructuredQueryBuilder sqb = queryManager.newStructuredQueryBuilder(); StructuredQueryDefinition query =sqb.collection("test

使用MarkLogicJava API列出集合

我想获得数据库中所有集合的列表。我知道如何使用XQuery代码执行此操作: cts:collections("*") 但我很难弄清楚如何使用MarkLogicJavaAPI实现这一点 我正在阅读StructuredQueryBuilder,但它似乎太复杂,无法实现我的目标 您可以使用ServerEvaluationCall执行XQuery ServerEvaluationCall call = databaseClient.newServerEval().xquery("cts:colle

来自sql绑定参数的MarkLogic Optic API

我正在尝试使用来自sql和XQuery的Optical API。我发现这是一种获取所需数据的好方法,但我试图找到使用op:fromsql将参数传递给占位符的清晰示例 比如说 let $result := op:from-sql(' SELECT name, sum(value) FROM db.namevalue WHERE client=''IBM''

尝试在MarkLogic中运行单点登录的XQuery脚本时出错

我正在研究使用xquery re-writer脚本来自动登录单点登录解决方案。我从8001端口的管理应用服务器开始。在应用服务器配置中,我有: 设置身份验证=应用程序级别 设置url重写器=rewriter.xqy 我还在服务器的根Admin/目录下设置了以下rewriter.xqy脚本。 正如您所看到的,作为一个简单的测试,我试图以编程方式以用户“Austin”(有效用户)的身份登录 但是,在回收Web服务器之后,我在浏览管理UI时不断出现以下错误。 只要我删除xdmp行,错误就会消失,我

Marklogic实体属性与有效母版的关系

我有一个关于MarkLogic中实体设计的最佳实践的问题。 在实体下设计属性时,它可以具有经典类型,也可以具有其他实体类型 例如: 实体A |-id(字符串) |-属性1(字符串) |-属性2(字符串) |-不动产3(实体B) 实体B |-id(字符串) |-属性1(字符串) |-属性2(字符串) 在设计实体之间的关系时,使用Marklogic提供的不同工具来链接实体,我们有不同的方式,我想听听您关于何时使用外部实体作为属性以及何时仅使用关系的建议 这一点非常重要,因为我个人发现,使用实体作为属

Marklogic 在Marlogic中存储XML数据的最佳方法

我对Marklogic世界还不熟悉。我的程序使用一个自定义Java应用程序,每30秒查询一次www.com获取XML数据源。结果以XML格式返回。Java应用程序使用XCC API(Marklogic API)将检索到的数据插入到单个XML文件中的ML中。数据大小为每分钟6MB,若应用程序运行一天左右,数据量将以GB为单位增长。我不知道要在MarkLogic中的单个XML文件中放入如此庞大的数据,我必须进行任何管理配置。是否有人可以验证我的方法,或者建议我是否必须在管理员级别进行任何配置更改。X

Marklogic 删除100000多个文件的最佳方式是什么?

我正在努力删除MarkLogic数据库中加载的大量文件。我要删除的目录中的文件数超过100000个。我通常使用以下两种方法来删除查询控制台中的文件。目录中的每个文件都被索引 for $x in xdmp:directory("/English/","infinity") return xdmp:document-delete(fn:document-uri($x)) 及 当我执行上述任何一个方法时,我得到了“超过时间限制”,这会破坏操作 我的问题是 有没有其他更好的方法来删除一堆文件 如果没有

使用MarkLogic mlcp拆分文档

我需要拆分这份文件 J 符号fü;拉模 斯特罗米奇特 . JZ Abk&x00FC;rzung f&x00FC;r Jod Zahl,siehe 费特肯扎伦 . 这是一个bug。如果愿意,可以下载MLCP的源代码并对其进行更改。看看AggregateXMLReader.java的processStartElement() 我复制了这个,但还没有找到解决办法。MLCP的源代码是可用的,所以答案应该在那里的某个地方。

Marklogic ML8中的多语句变量

我正在尝试使用分号作为语句分隔符执行多语句事务。我的脚本中有外部变量,这些变量只能在多步骤中的第一个语句中访问。。对于第二条语句xdmp:documentaddpropertiesI getxdmp-UNEXPECTED。。下面是我的代码 let $sub-query := 'xquery version "1.0-ml"; declare option xdmp:transaction-mode "update";

MarkLogic是否支持使用AWS弹性文件系统进行共享磁盘故障切换?

虽然文档对支持的内容(不是AWS弹性文件系统)以及共享磁盘故障切换的优缺点都非常明确和具体,但我认为至少值得询问是否有人尝试在共享磁盘故障切换配置中使用AWS弹性文件系统,或者这是否是共享磁盘故障切换的支持选项 有关AWS EFS的信息: 表示不支持的MarkLogic文档: 感谢您的任何想法和见解。文档中列出了明确“支持”的内容。这些都是经过测试且工作良好的配置。关于wrt对支持服务的任何具体含义,我建议询问您的客户代表 至于“尝试过的EFS”——我个人也尝试过,并且知道还有一些人已经进行了非

Marklogic 使用.xqj查询查询BaseX

我们可以像在Marklogic中使用.xqy查询xml一样使用.xqj文件来查询BaseX吗? 我认为在baseX中不能使用xqy进行查询。xqy在baseX和MarkLogic中都是有效的XQuery文件扩展名。您还可以使用xq、xqm、xql、xqu和xquery(但不包括xqj;请参阅) 但是,如果您通过BaseX命令行界面或可视前端寻址和运行查询文件,则文件扩展名无关紧要。为完整起见,MarkLogic支持这些开箱即用的扩展名:xqy、xqe、xq、xquery。您还可以通过将扩展名添加

MarkLogic是否提供schematron支持?

我使用的是MarkLogic 8.0-8版本 是否可以使用schematron验证XML 请帮我举个例子。这里有公开的XSLT样式表,可用于运行Schematron验证: 您可以在MarkLogic中运行这些。虽然有点过时,但这里有一个项目展示了如何做到这一点。它可能仍然有效: 嗯 这里有一些XSLT样式表可公开用于运行Schematron验证: 您可以在MarkLogic中运行这些。虽然有点过时,但这里有一个项目展示了如何做到这一点。它可能仍然有效: 嗯 MarkLogic还将Sche

在marklogic中检索数据期间,是否有方法对记录进行批处理

目前,我们正在尝试使用“查询”作为事务类型的xdmp:spawn函数来提高性能。所以,让我们假设一个搜索条件,我们有90个文档,我将其分为3批,每个批有30条记录。现在我在xdmp:spawn函数中发送30个记录ID并进行处理。最后,我积累了3批数据。这样做我能取得好成绩。但我们担心它可能会对集群中任务服务器中的某些线程的等待产生负面影响 您可以建议一些避免生成并仍然进行并行处理的方法吗?您可以使用,并将某些任务的优先级设置为比其他使用的任务低/高。您可以为批赋予正常优先级,为更关键的任务赋予更

如何在MarkLogic中计算应用程序服务器速率?

报告说: 请求速率每个应用服务器每秒处理的查询数 一个XQuery是指一个查询,还是一个XQuery将有许多查询 查询对MarkLogic意味着什么?我们如何计算XQuery中的查询数?我认为在本文中,“查询”指的是更常见的请求 假设您在/v1/resources/my resource加载自定义资源,并且my resource调用cts.search5次。如果您向/v1/resources/my resource发送100个请求,则相当于100个“查询”。它不是500个查询-即每个单独的cts

Marklogic 从根节点提取元素并填充每个文档

MarkLogic版本:9.0-6.2 下面是一个示例xml文件,我正在使用mlcp将其摄取到暂存数据库中。我的要求是将xml拆分为每个策略的单独文档,但在将TransactionRequestDt重新格式化为YYYYMMDDHHMMSS后,创建uri_id为/Policy/PolNum/TransactionRequestDt.xml。示例uri为/policy/P123/201610171533390000000.xml <?xml version="1.0" encoding="UT

Marklogic 编校超时的MLCP Copy命令

使用的ML版本:9.0-10.4 在大数据集(39753201个文档)上运行MLCP COPY命令。运行命令时,出现以下错误 2020-07-29 20:38:09 WARN NativeCodeLoader:62 - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable 2020-07-29 20:38:09 INFO ContentPump

Marklogic数据中心管理GUI

安装快速启动数据集线器时,它通常安装在端口8080或9000上(用户可配置) e、 g 我已经使用Gradle项目在9.0-13.1服务器上安装了5.2.6数据集线器 ( ) 然后运行mlDeploy命令,看起来一切正常,它在MarkLogic服务器中创建的服务等等,我可以连接到该服务器,所以一切正常 但是,我找不到这个Gradle部署的数据集线器的GUI界面在哪里,我想使用它(即与Quickstart的GUI相同)-我可以设置GUI来管理Gradle部署的数据集线器吗?或者,数据中心是否应该

在MarkLogic中从xquery模块调用Shell脚本

在MarkLogic中有没有直接的方法从xquery执行shell脚本或linux命令?Marklogic web服务器是否支持CGI 现在,您无法从MarkLogic执行shell脚本或文件系统可执行文件,MarkLogic也不支持CGI。实现这种集成的最简单方法是建立一个您熟悉的应用服务器(Java/Tomcat、ASP、PHP等)的副本,并通过http在MarkLogic和该服务之间进行通信 有一个开放的增强请求来支持执行文件系统可执行文件。前面我使用了MLJAM调用java代码,然后从j

marklogic树缓存-共享资源?

如果我运行一个非常愚蠢的查询,将大量节点加载到扩展树缓存中,我会影响MarkLogic上运行的其他查询吗?换句话说,扩展的树缓存是共享资源还是有部分分配给我的连接?是的,缓存是共享的 每个缓存在组级别配置,并在主机级别分配。给定主机上的所有并发查询共享相同的缓存空间。对于应用服务器,这意味着扩展的树缓存,而任何林查找都将使用列表缓存和压缩的树缓存空间。是,缓存是共享的 每个缓存在组级别配置,并在主机级别分配。给定主机上的所有并发查询共享相同的缓存空间。对于应用服务器,这意味着扩展的树缓存,而任何

如何在MarkLogic中查找文档的创建日期?

如何在MarkLogic中查找文档的创建日期 我希望找到像xdmp:document-creation-date()这样的东西 谢谢。如果您在数据库选项中启用MarkLogic(我认为默认情况下它已启用),它将自动运行,但对于创建日期,您需要自己跟踪它。一种常见的模式是在插入文档时将该值存储在属性或文档属性中。最后修改的时间戳存储为文档属性,因此将创建时间戳也存储在其中可能最有意义。Last modified过去是默认启用的,但他们在ML6或ML7中更改了默认值,因为它经常创建许多额外的db片段

使用父子上下文搜索文档:Marklogic

我有以下XML。当我搜索班加罗尔市和Telegana州时,它不应该返回任何结果,因为城市和州属于不同的地址元素 XML Document : <person> <name>Sundeep</name> <address> <city>Bangalore</city> <state>Karnataka</state> </address&g

Marklogic “为什么多个”;“收藏”;REST搜索请求中的URL参数是否不返回结果?

根据MarkLogic文档,“collection”参数可以在对REST客户端API的GET请求中多次出现;但是,以下返回0个结果: /LATEST/search?q=&collection=GEWN&collection=TSJN 而在同一数据库上指定两个集合的XQuery会返回预期结果: count(collection(("GEWN","TSJN"))) => 90871 使用RESTAPI单独查询一个命名集合也会返回预期结果 谢谢。URI参数提供的集合是相互关联的。作

MarkLogic组合cts:query和search:query

我有一个结构化查询输入,如: <query xmlns="http://marklogic.com/appservices/search" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:search="http://marklogic.com/appservices/search" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <and-query>

Marklogic任务服务器中队列大小增加的影响

将队列大小从默认的100000增加到500000有什么影响 是否有经验法则来计算合理的最大数量 使用可用资源(如RAM、CPU核心和需要考虑的任何其他资源)的队列大小 任何建议都将不胜感激。这不会影响CPU,但对内存的影响有限。队列保存在内存中(例如,服务器重新启动后它将无法生存),它需要跟踪您输入队列上每个任务的所有参数。如果你给他们每人提供一个包含1百万个id的列表,那就比只给每个人提供10或1个id要多得多 还要记住,任务服务器只有有限的线程(通常为16个)来处理队列。增加队列大小确实会影

在MarkLogic中是否有一种方法可以以优化的方式为所有数据库安排备份?

我在我们公司担任40多个MarkLogic集群的管理员。 每个数据库都有不同的数据库和数据库大小。 我想知道是否有人编写了代码来一次性创建所有数据库备份 目前,我正在使用一个xqy脚本检查所有数据库,并为每个数据库安排备份。 我在每次备份之间安排5分钟的时间,因为同时运行2个备份可能会导致磁盘上的文件不一致(至少过去是这样) 最好能够在群集级别(而不是数据库级别)计划备份,并且该计划应负责为群集中的所有数据库创建备份(具有排除某些数据库或特别包括某些数据库的选项) 此群集备份应该对第一个数据库进

集成Marklogic Envision和DataHubFramework

我尝试将DHF中的数据集成到envision 1.0.5中。(我知道有v2.0.2,但我认为基本观点是一样的)。 我所能做的就是在“连接”部分查看实体 有此工具示例的教程将非常有用 下面的一些问题在文档中也没有看到。如有任何帮助,请回答以下问题 这个工具生产准备好了吗 这是否可以用来代替其他可视化工具,如Neo4j, Graphviz等 如果基础数据库不是三重存储/图形数据库,它可以吗 仍然在“探索”部分集成和显示内容吗 我们可以使用这个工具来创建RDF三元组吗 有文件 youtube上还有关于

如何在marklogic中将超级数据库配置从一台主机克隆到另一台主机

我有一个超级数据库在一个主机。我在其他主机中有相同的子数据库,现在我想用相同的配置创建超级数据库。如何做到这一点 请帮忙。这将节省时间。所有数据库配置详细信息将在MarkLogic server中的/var/opt/MarkLogic/databases.xml文件中提供。因此,您可以将数据库配置从一台主机复制到另一台主机数据库xml。您可以这样尝试最简单的方法是使用Configuration Manager。将浏览器指向,然后单击Configuration Manager。单击“导出”选项卡。

Marklogic sparql查询默认检索顺序

我们正在使用语义在Marklogic数据库中保存一个树结构。我们创建了一个名为“childof”的自定义谓词,并存储了这些子项 Java对象: public class HierarchyTree { private String documentUri; private List<HierarchyTree> children; public String getDocumentUri() { return documentUri; } public void se

Marklogic 获取XDBC服务器的日志文件时出错,请建议可能出现的问题?

任何XDBC或XCC capibile HTTP AppServer的访问日志(AccessLog.txt)都会显示这一点。XDBC是使用HTTP(一种简化形式)实现的。“临时”XDBC Eval使用“/Eval/endpoint”的“POST”方法。正如Dave所说,您正在看到成功的XDBC调用 如果使用端口8000或REST端口(ML版本8+),则可以在同一端口上执行HTTP、REST和XDBC调用。结果将是来自所有客户端的混合访问日志 “它只是HTTP”任何XDBC或XCC capibil

MarkLogic:当load_date没有范围索引时,根据load_date筛选文档

我无法根据加载日期筛选文档。我想对指定日期之前/之后加载的文档进行计数。我在数据库里有大约2200万份文件。我无法使用cts:element范围查询,因为开发人员尚未在“loaddate”元素上创建范围索引。这阻止了我从测试角度验证加载的内容 请帮我选择 问候,, Hari选项1是让开发人员在加载日期创建范围索引——这是解决这个确切问题的预期方法,应该是首选解决方案 如果您不能这样做(可能这是一个一次性查询,因此添加索引会遇到阻力),但是日期采用了正确的YYYY-MM-DD格式,那么您可以进行字

在MarkLogic中检索不带范围索引的元素值

我在MarkLogic中有以下情况。我有一个包含大量文档的数据库,每个文档包含数百个字段。现在让我们假设,对于其中一个字段,我希望使用cts:search从一大组文档中检索所有值。我有什么选择 显然,我可以在这里使用范围索引。然而,当我探索我的数据集时,这意味着我必须将范围索引应用于我的所有字段,这似乎。。。。太过分了。此外,我完全同意每个查询都需要一点时间 因此,我尝试运行一个简单的cts:search查询:cts:search//Cost,cts:collection querymyColl

Marklogic 如何计算http应用程序服务器的请求速率?

所以,在检查history dashboard时,对于特定的http服务器,例如请求速率,我看到了几条直线 abc-dashboard-http 21.27 request/sec xyz 14.68 request/sec 他们代表正确吗?我想知道请求速率是如何计算和存储在表中的。 对于abc dashboard,我知道每分钟都会发出一个请求,集群中有30个节点。按照这种情况,可能会出现1/60请求/秒或(1*30)/60请求/秒,但我们在仪表板中看到的原始内容对我来说没有意义。怎样?为了更

Marklogic JSON文档的模式验证

我正在使用MarkLogicServer9.0-6.2和DHF版本2.0.6。该方法在此版本的MarkLogic中不可用 有人能建议如何在MarkLogic 9.0-6-2中对JSON文档执行模式验证吗?xdmp.jsonValidate是最好的方法MarkLogic 如果您使用的版本不支持它,您可以使用另一个验证器。MarkLogic支持在服务器上运行JavaScript,因此任何JavaScript Json验证器都很可能在MarkLogic上工作 下面是来自json-schema.org的

用于禁用计划任务的MarkLogic函数

是否有MarkLogic内置功能来禁用组计划任务 在我知道这样的函数已经存在之前,我创建了自己的函数- xquery version "1.0-ml"; import module namespace admin = "http://marklogic.com/xdmp/admin" at "/MarkLogic/admin.xqy"; import module namespace mem = "http://xqdev.com/in-mem-update" at "/MarkLogic/

marklogic xdmp:http post选项参数问题

正在尝试从另一个配置XML构建options参数以传入xdmp:httppost函数 let $db-config := <config> <user-name>admin</user-name> <password>admin</password> </config> let $options := <options xmlns="xdmp:http">

如何检查MarkLogic群集的内存和空间?

是否有一个查询可以用来获取/计算MarkLogic server的内存/空间详细信息?如果要查找CPU,可以使用监控历史记录。Mem和其他特定于MarkLogic的统计信息。周期选择Raw会提供7天前的详细信息,除非您在管理界面中更改了仪表设置 你也可以自己收集信息。它主要由xdmp:host status和xdmp:forest status等函数驱动,但它可以方便地在后台为您收集这些信息,同时也为您提供了一个历史视角 ErrorLog.txt中还记录了按主要区域划分的详细内存使用情况,并定期

  1    2   3   4   5   6  ... 下一页 最后一页 共 26 页