找回密码
 FreeOZ用户注册
查看: 3036|回复: 6
打印 上一主题 下一主题

[IT技术] 有IT大神帮忙下吗, 有偿的

[复制链接]
跳转到指定楼层
1#
发表于 30-1-2015 16:27:18 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?FreeOZ用户注册

x
本帖最后由 ohxsy 于 30-1-2015 16:41 编辑

用JAVA语言 用一定的方法解析多个xml文件(他们的格式是一样的),抽取出一些指定标签里的内容,并对不同的内容按三种格式中的一种进行显色输出,同时把一些属性抽取出来放在各自的list里,以下是xml文件里的一部分

<?xml version="1.0"?>
<!DOCTYPE source_file SYSTEM "apf.v5.1.1.dtd">
<source_file URI="CNR20001109.1700.1220.sgm" SOURCE="broadcast news" TYPE="text" AUTHOR="LDC" ENCODING="UTF-8">
<document DOCID="CNR20001109.1700.1220">
<entity ID="CNR20001109.1700.1220-E1" TYPE="VEH" SUBTYPE="Land" CLASS="SPC">
  <entity_mention ID="CNR20001109.1700.1220-E1-1" TYPE="NOM" LDCTYPE="NOM">
    <extent>
      <charseq START="64" END="69">中国福建汽车</charseq>
    </extent>
    <head>
      <charseq START="68" END="69">汽车</charseq>
    </head>
  </entity_mention>
</entity>
In this example  it need extaract out 汽车 to out put in color.
回复  

使用道具 举报

2#
发表于 30-1-2015 16:44:47 | 只看该作者

评分

参与人数 1威望 +50 收起 理由
ohxsy + 50 谢谢!

查看全部评分

回复  

使用道具 举报

3#
发表于 30-1-2015 17:34:16 | 只看该作者
I think it's simple if by Xpath.
回复  

使用道具 举报

4#
发表于 30-1-2015 18:02:07 | 只看该作者
用正则两行代码搞定。。
回复  

使用道具 举报

5#
发表于 30-1-2015 18:13:05 | 只看该作者
我的第一反应是遍历dom,
回复  

使用道具 举报

6#
发表于 30-1-2015 18:17:08 | 只看该作者
Mr.Q 发表于 30-1-2015 16:02
用正则两行代码搞定。。

Yes, but  since it's XML, using XML way should be more readable.
回复  

使用道具 举报

7#
发表于 6-2-2016 00:04:57 | 只看该作者
用XPath或beautifulsoup应该不难搞定
回复  

使用道具 举报

您需要登录后才可以回帖 登录 | FreeOZ用户注册

本版积分规则

小黑屋|手机版|Archiver|FreeOZ论坛

GMT+11, 22-2-2025 12:36 , Processed in 0.038982 second(s), 23 queries , Gzip On, Redis On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表