実現したいこと
デベロッパーモードで html ページの特定の要素の html ソースを文字列としてコピーして、
コピーした文字列をパースしたいのですが、表記のように  
で html ソースを定義しているのに対し、デベロッパーモード の要素タブでは
に変換されて表示されてしまうため、XML 文書としてパースしようとすると、エラーとなってしまいます。
以下は Powershell で
を含む xml 文字列をパースしてエラーとなる例です。
powershell
1"1" 個の引数を指定して "Parse" を呼び出し中に例外が発生しました: "宣言されていないエンティティ 'nbsp' への参照です。 行 1、位置 7。"2発生場所 D:\git\yakenohara\Python-FormXMLStringInClip\test.ps1:4 文字:1 3+ $x = [System.Xml.Linq.XDocument]::Parse('<div> </div>')4+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 5 + CategoryInfo : NotSpecified: (:) [], MethodInvocationException 6 + FullyQualifiedErrorId : XmlException
デベロッパーモードの要素タブ上で、元の html ソースのまま要素をコピーする方法はあるでしょうか?
試したこと
xml 文字列をパースには、以下の方法でパースを試みましたが、すべてパースエラーとなってしまいました。
は HTML では使用可だけれど、 XML としては使用不可ということでしょうか?
- Powershell
[System.Xml.Linq.XDocument]::Parse()
でパース
xml.dom.minidom を import して .parseString()
でパース
xmldom パッケージをインストールして (new DOMParser()).parseFromString()
でパース
確認環境
OS:Windows10 (22H2)
ブラウザ:Chrome (126.0.6478.126)
0 コメント