透过xml生成word文书档案

STEP_DESCLacrosseIPTION步骤描述

5、文书档案修改历史

Xml生成word总结

  
使用xml生成word的核心步骤在《使用xslt转化xml数据形成word文书档案导出.doc》中表达比较清楚了。可是中间的细节尚未聊起,因而本身折腾了两日总算成功了。以下是自己在动用进度中相遇的标题要点:

 

一,项目背景

在Python即时互连网爬虫项目表明一文大家说过要做3个通用的网络爬虫,而且能省去程序员大半的时间,而关键难点就是提取器使用的抓取规则需求飞快变动。在python使用xslt提取网页数据一文,大家早就看到这一个提取规则是xslt程序,在示范程序中,直接把一长段xslt赋值给变量,可是从未讲那壹段xslt是怎么来的。

网上朋友肯定会狐疑:那一个xslt这么长,编写不是要花很短日子?

实则情况是,那一个xslt是透过GooSeeker的MS谋数台的直观标注功用自动生成的,熟习的话1分钟就解决了。

<?xml version="1.0" encoding="utf-8"?>

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

<xsl:template match="/">
 <html>
 <Head>
        <style type="text/css">

          body {
          background:#fff;
          margin:0;
          padding:40px 20px;
          font-family: "Arial", Arial, Sans-serif;
          font-size: 16px;
          color:#000;
          }

          table {
          margin:5px 5px 0;
          border:0px solid #222;
          font-size: 0.8em;
          }

          td {
          margin:5px 5px 0;
          padding:10px 10px 10px 10px;
          vertical-align:text-top;
          border:1px solid #222;
          border-width:1px 1px 1px 1px;
          }

          td.light {
          border:0px solid #222;
          }

          td.number {
          text-align:right;
          }

          td.status {
          text-align:right;
          vertical-align:text-bottom;
          }

        </style>


 </Head>
 <body>
   <!--OVER RESULT -->
   <xsl:variable name="OVER_STATUS" select="REPORT/OVER_STATUS"/>
   <xsl:variable name="STATUS" select="REPORT/LOG_ENTRY/STATUS"/>



   <h2>自动化测试执行报告</h2>
   <!--table -->
   <table border="1">
     <!--all result value-->
     <tr bgcolor="white" height = "35">
        <td>Overall Test Result</td>
        <td><xsl:value-of select="$OVER_STATUS"/></td>
        <td colspan="2"> </td>
     </tr>

     <tr bgcolor="#D8BFD8" height = "35">
       <th>执行时间</th>
       <th>单步结果</th>
       <th>响应CODE</th>
       <th>Response信息</th>
     </tr>



       <!--select font color -->
       <xsl:variable name="fontColor">
           <xsl:choose>
               <xsl:when test="$STATUS = FAILED or $STATUS = PASSED">
                   <xsl:text>white</xsl:text>
               </xsl:when>
               <xsl:otherwise>black</xsl:otherwise>
           </xsl:choose>
       </xsl:variable>

       <!--background color-->
       <xsl:variable name="backgroundColor">
           <xsl:choose>
               <xsl:when test="$STATUS = 'FAILED'">
                   <xsl:text>rgb(255,0,0)</xsl:text>
               </xsl:when>
               <xsl:when test="$STATUS = 'PASSED'">
                   <xsl:text>rgb(60,179,113)</xsl:text>
               </xsl:when>
               <xsl:otherwise>
                   <xsl:text>white</xsl:text>
               </xsl:otherwise>
           </xsl:choose>
       </xsl:variable>

       <!--log entry-->
       <xsl:for-each select = "REPORT/LOG_ENTRY">


           <tr>
               <td><xsl:value-of select="EXECUTION_TIME"/></td>
               <td bgcolor="{$backgroundColor}"><xsl:value-of select="STEP_RESULT"/></td>
               <td><xsl:value-of select="COMPONENT_NAME"/></td>
               <td><xsl:value-of select="STEP_DESCRIPTION"/></td>
           </tr>
       </xsl:for-each>

       <tr bgcolor="white">
           <font color="{$fontColor}">
               <td colspan="4">Overall Test Result:<xsl:value-of select="$OVER_STATUS"/></td>
           </font>
       </tr>
   </table>
 </body>
 </html>
</xsl:template>
</xsl:stylesheet>

其三步,点击工作台的“测试”按钮,xslt就生成了,在“数据规则”窗口体现出来

不要选别的namespace

图片 1

log_03_doc.xml生成log_0三.xslt时会弹出上述对话框,不要随便再选别的namespace。
生成的xslt截图

 

 图片 2

 

图片 3

借使再选中别的namespace,生成的xslt也不是大家要的。生成xslt截图

图片 4

显明跟下面的不等同。

 图片 5

 

 图片 6

 

 

 

四,怎么着使用XSLT

在python使用xslt提取网页数据一文,大家把生成xslt作为1个字符串交给程序,给人倍感好像1转眼再次回到了史前文明,后面讲的那么好,最终用了很原始的正片。其实不然,那么些只是2个事例。在python即时网络爬虫项目:
内容提取器的概念一文已经初见端倪了,有三种流入xslt的方式,最自动化的方法是api,将在三番五次小说中详细讲解。

以下代码创立根节点做为了3个独自的函数,之所以这么做因为要转移的报告,只创制三个根节点,和over_status
结果景况

在《Python即时网络爬虫项目表达》一文大家说过要做多个通用的网络爬虫,而且能省掉程序员大半的光阴,而难题难题正是提取器使用的抓取规则须要急速变化。在python使用xslt提取网页数据一文,大家早已见到那几个提取规则是xslt程序,在演示程序中,直接把一长段xslt赋值给变量,可是未有讲那一段xslt是怎么来的。

陈设图片

要实现插入图片,须要修改log_03.doc.

图片 7

再度生成log_03.xslt,并修改<ns0:image>节点。

一、删除全体v:shapetype 节点

二、删除 
<w:binData节点中的数据,并添加<xsl:value-ofselect=”.”/>

图片 8

修改以往

图片 9

3、修改v:shape 节点,去掉 style 属性,增加xsl 节点,如下:

图片 10

图片 11

 

四、去掉w:pict 节点后边的带<xsl:value-ofselect=”.”/>的具备节点

事例中去掉了如下代码:

<w:r>

         <w:t>

           <xsl:value-of select=”.” />

         </w:t>

  </w:r>

比方没做第伍步,则在word中会出现图片的贰进制代码。

 

 

例子:

  QDomDocumentdom;

    QDomProcessingInstructionproc =

       dom.createProcessingInstruction(

       “xml”,

       “version=\”1.0\”standalone=\”no\””

       );

    dom.appendChild(proc);

 

    QDomElementr =dom.createElement(“log”);

    dom.appendChild(r);

    r.setAttribute(“xmlns”,”logs”);

    QDomElementuserNode =dom.createElement(“user”);

    r.appendChild(userNode);

    QDomTextuserTextNode =dom.createTextNode(“john”);

    userNode.appendChild(userTextNode);

 

    QDomElementloginNode =dom.createElement(“login”);

    r.appendChild(loginNode);

    QDomTextloginTextNode =dom.createTextNode(“2015-01-1811:10:12”);

    loginNode.appendChild(loginTextNode);

 

    QDomElementlogoffNode =dom.createElement(“logoff”);

    r.appendChild(logoffNode);

    QDomTextlogoffTextNode =dom.createTextNode(“2015-01-1813:10:12”);

    logoffNode.appendChild(logoffTextNode);

 

    QDomElementimageNode =dom.createElement(“image”);

    r.appendChild(imageNode);

    QStringpng;

    FILE*fpng =fopen(“2.jpg”,”rb”);

    if( fpng )

    {

       encode(fpng,png,0 );

       fclose(fpng );

    }

    imageNode.setAttribute(“style”,”width:300pt;height:300pt” );

    charszBuffer[256];

    //sprintf(szBuffer,”wordml://5.png”);

    imageNode.setAttribute(“key”,”2.jpg” );

    QDomTextlogonNodeTextNode =dom.createTextNode(png);

    imageNode.appendChild(logonNodeTextNode);

 

 

 

    QStringxml =dom.toString();

    QFilefile(“log.xml”);

    if(file.open(QIODevice::WriteOnly))

    {

       QTextStreamoutput( &file);

       output.setCodec(QTextCodec::codecForName(“UTF-8”));

       //QStringcontent = dom.toString();

       output<< xml;

       file.close();

    }

 

 

    QStringsrc =”msxsl.exe”;

    QStringsrc1 =”log.xml”;

    QStringsrc2 =”log_03.xslt”;

    QStringsrc3 =QString(“122″)+”.doc”;

 

    QProcess*proce =newQProcess( );

    QStringListargumentList;

    argumentList.append(src1 );

    argumentList.append(src2 );

    argumentList.append(“-o”);

    argumentList.append(src3 );

 

    proce->start(src, argumentList );

    bool ret =proce->waitForStarted( 5000 );

 图片 12

5,文书档案修改历史

201六-0五-二陆:V二.0,增补文字表明
201陆-0伍-28:V三.0,增添第三章

<?xml version="1.0" encoding="utf-8"?>
    <?xml-stylesheet href="LOG.XSLT" type="text/xsl"?>
    <REPORT>
        <OVER_STATUS>PASSED</OVER_STATUS>
        <LOG_ENTRY>
            <STATUS>FAILED</STATUS>
            <EXECUTION_TIME>2017.06.15 15:57:16</EXECUTION_TIME>
            <STEP_RESULT>FAILED</STEP_RESULT>
            <COMPONENT_NAME>704</COMPONENT_NAME>
            <STEP_DESCRIPTION>{u'nextUrl': u'http://www.elong.com', u'message': u'\u9a8c\u8bc1\u7801\u9519\u8bef', u'code': u'704', u'success': False, u'isShowVerifyCode': True}</STEP_DESCRIPTION>
        </LOG_ENTRY>
        <LOG_ENTRY>
            <STATUS>FAILED</STATUS>
            <EXECUTION_TIME>2017.06.15 15:57:16</EXECUTION_TIME>
            <STEP_RESULT>FAILED</STEP_RESULT>
            <COMPONENT_NAME>704</COMPONENT_NAME>
            <STEP_DESCRIPTION>{u'nextUrl': u'http://www.elong.com', u'message': u'\u9a8c\u8bc1\u7801\u9519\u8bef', u'code': u'704', u'success': False, u'isShowVerifyCode': True}</STEP_DESCRIPTION>
        </LOG_ENTRY>
    </REPORT>

MS谋数台界面分成三片段:DOM数窗口、内嵌浏览器窗口、工作台。在工作台上定义xslt转换规则。

非得采纳word 200三.

1.底下通过例子演示:

图片 13

图片 14

 

简短 的xml以及对应的xml框架

 

2.分别创设0三版本的word文档log_03.doc和o7版本的word文档log_0柒.docx,并都施用以上生成的log.xsd框架

图片 15

 

独家另存为log_03_doc.xml,log_07_doc.xml。

3.
用log_03_doc.xml,log_07_doc.xml生成xslt文件log_03.xslt和log_07.xslt。

图片 16

 

log_03_doc.xml生成log_0叁.xslt时会弹出以上对话框,仅仅选中xml中钦赐的namespace就足以了。

 图片 17

 

log_07_doc.xml生成log_0七.xslt时会弹出上述对话框,正是从未xml中钦赐的namespace,全数无论怎么选,生成的xslt都不是大家想要的。

2,MS谋数台能做什么样

MS谋数台有个图形化界面,把一名目繁多html解析工具集成在一起,包蕴:
1)基于直观标注自动生成XSLT
贰)即时测试XSLT的不利
三)树状的DOM结构展现
4)剖析有个别DOM节点的习性
五)为DOM节点生成XPath,可挑选稳定到class、或许id、可能绝对定位
6)根据xpath搜索DOM节点

MS谋数台界面分成叁局地:DOM数窗口、内嵌浏览器窗口、工作台。在工作台上定义xslt转换规则。

始建节点用,createElement,之后用appendChild扩充节点到xml对象

通过以上的操作,不用编制程序,用图形化界面直接在页面上标注,一分钟就能够生成xslt

三,用MS谋数台湾学生成XSLT

若果大家要抓取论坛帖子列表,下边一步步上课操作方法:

第一步,打开GooSeeker的MS谋数台,输入要抓取的网站
第二步,在MS谋数台的浏览器展现窗口里,直接选拔要提取的始末,并且起个名字,点击确认

图片 18

第三步,点击工作台的“测试”按钮,xslt就生成了,在“数据规则”窗口显示出来

图片 19

通过以上的操作,不用编制程序,用图形化界面直接在页面上标注,1秒钟就能够生成xslt

以下代码意思是:成立贰个over_status的节点,节点文本为passed,然后,将此节点扩张到根节点REPOHavalT下

以上正是本文的全体内容,希望对大家的求学抱有帮衬,也期望我们多多援救脚本之家。

 

一、项目背景

 

1分钟火速转移用于网页内容提取的xslt,具体内容如下

STATUS单行数据实施情形

在python使用xslt提取网页数据一文,大家把生成xslt作为1个字符串交给程序,给人备感好像1转眼重回了西晋文明,前面讲的那么好,最终用了很原始的正片。其实不然,那多少个只是三个例证。在《python即时互连网爬虫项目:
内容提取器的概念》一文已经初见端倪了,有多样流入xslt的方法,最自动化的方法是api,将在此起彼伏文章中详细讲解。

三.创立2个REPO君越T根节点,你也能够起名ROOT,叫什么名字看您本身了

网上朋友肯定会疑忌:那几个xslt这么长,编写不是要花非常长日子?

 

假使大家要抓取论坛帖子列表,上边一步步教学操作方法:
先是步,打开GooSeeker的MS谋数台,输入要抓取的网站
第二步,在MS谋数台的浏览器展现窗口里,直接选取要提取的情节,并且起个名字,点击确认

2.生成xml结构

图片 20

import xml.dom.minidom as xmlDoc  #xmlDoc起的别名

xmldoc = xmlDoc.Document

4、如何利用XSLT

发表评论

电子邮件地址不会被公开。 必填项已用*标注