Aspose.HTML для Java – это расширенный API для работы с HTML файлами, позволяющий манипулировать и генерировать HTML в приложениях Java. API позволяет добавлять, удалять, заменять узлы, извлекать CSS и перемещаться по документу несколькими способами. Кроме того, API предоставляет возможность загрузки EPUB и MHTML, а также предлагает скрипты, позволяющие манипулировать DOM с помощью JavaScript.
Aspose.HTML для Java поддерживает межфайловое преобразование формата для загрузки HTML-документа и сохранения вывода в XPS, PDF и растровых изображениях, включая JPEG, PNG, BMP и другие, а также обеспечивает шифрование файлов PDF.

Расширенные функции Java HTML Processing API

Создание HTML-страниц с нуля

Загрузить существующий файл

Реализовать спецификации W3C

Легкий и автономный компонент

Вставка, замена или удаление узлов

Извлечение информации о стилях CSS

Загрузка форматов документов EPUB и MHTML

Рендеринг HTML в растровые изображения

Возможности API в документации

Вы можете увидеть полный список функций Aspose.HTML в нашей документации. Использование библиотеки Aspose.HTML for Java в вашем проекте позволяет выполнять следующие задачи:

  • Создание или открытие существующего HTML-документа из разных источников (Aspose.HTML.Examples.QuickStart.DocumentOpenTests в проекте примеров).
  • Управление HTML документом: создание, редактирование, удаление и замена узлов HTML с помощью API.
  • Сохранение HTML-документа.
  • Извлечение стилей CSS для определенного узла HTML.
  • Настройка изолированной программной среды для документов, которая влияет на обработку HTML-документов.
  • Навигация по HTML-документу различными способами.
  • Конвертация документа HTML в различные поддерживаемые форматы: JPEG, PNG, BMP, TIFF, PDF, XPS и другие.

Преобразование HTML в формат PDF и XPS

API поддерживает рендеринг HTML в наиболее часто используемые растровые изображения, включая форматы BMP, TIFF, JPEG и PNG, PDF и XPS. Разработчики могут настроить параметры PageSetup для результирующих форматов с фиксированным макетом, включая номера отображаемых страниц, результирующий размер страницы или настройку сжатия JPEG для встроенных изображений.

Отображение HTML в виде форматов с фиксированным макетом – Java


     
    // Load a file to be rendered
    HTMLDocument htmdoc = new HTMLDocument(dir + "template.html");

    // Render HTML to PDF & XPS
    HtmlRenderer renderer = new HtmlRenderer();

    renderer.render(new PdfDevice(new PdfRenderingOptions(), dir + "output.pdf"), htmdoc);
    renderer.render(new XpsDevice(new XpsRenderingOptions(), dir + "output.xps"), htmdoc);


Вы можете попробовать в работе онлайн Конвертер HTML.

Вы также можете конвертировать HTML, XHTML, MHTML, Markdown, EPUB или SVG во многие другие форматы файлов, включая некоторые из перечисленных ниже:

Конвертация в растровые изображения

Aspose.HTML для Java предлагает высокоточный механизм рендеринга, который может преобразовывать HTML-страницы в наиболее часто используемые форматы растровых изображений, включая TIFF, BMP, PNG и JPEG, без необходимости использования какого-либо дополнительного программного обеспечения или инструмента.

Управление файлами EPUB и MHTML

Библиотека способна загружать файлы EPUB и MHTML для выполнения различных операций, включая преобразование в форматы с фиксированным макетом и растровые изображения.

Навигация по узлам HTML

API поддерживает навигацию по файлу HTML с помощью XPath, элементов или запросов селектора CSS, и можно легко вставлять, извлекать, удалять или заменять узлы.

Извлечь все узлы типа привязки – Java


     
    // instance creation of HTMLDocument and loading HTML from URL
    HTMLDocument dct = new HTMLDocument("https://www.aspose.com");

    // get all anchor type nodes 
    NodeList nodelist = dct.getDocumentElement().querySelectorAll("a");

    // display anchor text & href values for all nodes
    for (Node node : nodelist){

        HTMLAnchorElement anchor = (HTMLAnchorElement)node;
        System.out.println("Text: " + node.getTextContent() + " Href: " + anchor.getHref());
    }



Настроить песочницу

HTML API позволяет настроить изолированную программную среду документа, которая влияет на обработку HTML-документов, т.е. стили CSS в некоторых случаях зависят от размера экрана.



  
  

Aspose.HTML предлагает отдельные API-интерфейсы обработки HTML для других популярных сред разработки, перечисленных ниже: